Войти
ПрограммированиеФорумОбщее

MemTest 64/128 (3 стр)

Страницы: 1 2 3 4 5 Следующая »
#30
17:23, 18 авг. 2019

eDmk
а у кого не виндовс 10?

#31
17:28, 18 авг. 2019

Mira
> а у кого не виндовс 10?
А причем здесь 10ка?

#32
17:31, 18 авг. 2019

Vlad2001_MFS
> А причем здесь 10ка?
как скопировать из консоли? там же не работает буфер обмена ниже 10

#33
(Правка: 17:35) 17:34, 18 авг. 2019

Mira
В смысле не работает? Я в 7ке спокойно из стандартной консоли копировал. Выделил текст и Enter. Вставить текст - ПКМ.

#34
17:51, 18 авг. 2019

Vlad2001_MFS
пришлось гуглить, действиельно можно скопировать через жопу и не удобно.

MemSpeed(64/128) by eDmk, 2019

Процессор: Intel(R) Pentium(R) CPU G3220 @ 3.00GHz
Материнская плата: H81M-C (ASUSTeK COMPUTER INC.)

Всего памяти: 15,94 Гб
Объем для тестов: 2,00 Гб
Кол-во циклов чтения/записи: 10

1. Запись Bytes: 18,05 Гб/с
2. Запись DWords: 18,85 Гб/с
3. Копирование DWords: 6,71 Гб/с
4. Копирование системой: 5,25 Гб/с
5. Запись QWords: 18,32 Гб/с
6. Чтение QWords: 12,33 Гб/с
7. Запись DQWords через кэш (WT): 8,22 Гб/с
8. Запись DQWords без кэша (NTH): 16,03 Гб/с
9. Чтение DQWords без кэша (NTH): 13,64 Гб/с
X. Запись DWords без кэша (NTH): 10,77 Гб/с
R. Скорость регистров общего назначения: 20,35 Гб/с
M. Скорость XMM-регистров: 41,41 Гб/с

Общий объем чтения/записи:  240,00 Гб

Латентность (64 бита):
Чтение (1/8 байт): 0,57/4,59 нс
Запись (1/8 байт): 0,85/6,82 нс

#35
(Правка: 21:14) 20:54, 18 авг. 2019

Заинтересовался вопросом, попробовал позапускать разное через VTune
На моем

Процессор: Intel(R) Core(TM) i5-4670 CPU @ 3.40GHz
Материнская плата: H87-HD3 (Gigabyte Technology Co., Ltd.)

Зануление 1GB памяти через обычный mov, или mov*ps приводит к тому, что 8GB/s DRAM Bandwidth уходит на чтение и 8GB/s на запись

Зануление памяти через stos* или movnt* (_mm_stream*) приводит к тому, что 20GB/s DRAM Bandwidth уходит на запись и 0.3 (для stos) и 0.05 (для movnt) на чтение

Т.е. архитектурно, stos умеет сама определять когда надо делать запись мимо кеша, но немного тупит

Зануление в несколько потоков ничем не отличается, выдает те же 20GB/s

Подозреваю, что на более современных машинах занять всю пропускную способность одним ядром не получится

Использовал вот такой тест

+ Показать

С вот такими параметрами компиляции

+ Показать

PS:
Похожая ситуация с копированием 1GB памяти,
-movs* работает аналогично mov для чтения+movnt для записи - половина DRAM Bandwidth уходит на чтение, половина на запись
-mov для чтения + mov для записи - две трети DRAM Bandwidth уходит на чтение, треть на запись

#36
21:39, 18 авг. 2019

CD
У современных CPU к сожалению на все ядра одна пропускная способность.
Ничего не сделаешь. Хотя может я и не знаю чего. Это интеловских инженеров надо спрашивать.
Может совет дельный дадут.

#37
10:03, 19 авг. 2019

У меня ноутбук, память одноканальная, и результат более-менее совпадает с Aida. Тест показывает 12 Гб/c чтение, 15 Гб/c запись, у Aida чтение 16 Гб/c (запись не показывает - триал).
Видимо, Aida как-то умеет использовать многоканальность. Может несколько потоков попробовать?

#38
10:50, 19 авг. 2019

Win 10, En UI

MemSpeed(64/128) by eDmk, 2019

?????????: Intel(R) Xeon(R) E-2176M  CPU @ 2.70GHz

????????? ??????: 16.98 ??
????? ??? ??????: 4.00 ??
???-?? ?????? ??????/??????: 20

1. ?????? Bytes: 22.66 ??/?
2. ?????? DWords: 23.28 ??/?
3. ??????????? DWords: 8.45 ??/?
4. ??????????? ????????: 8.22 ??/?
5. ?????? QWords: 24.86 ??/?
6. ?????? QWords: 16.25 ??/?
7. ?????? DQWords ????? ??? (WT): 13.58 ??/?
8. ?????? DQWords ??? ???? (NTH): 31.61 ??/?
9. ?????? DQWords ??? ???? (NTH): 20.31 ??/?
X. ?????? DWords ??? ???? (NTH): 14.51 ??/?
R. ???????? ????????? ?????? ??????????: 29.94 ??/?
M. ???????? XMM-?????????: 59.52 ??/?

????? ????? ??????/??????:  960.00 ??

???????? ??????/?????? (64 ????):
R (1/8 ????): 0.19/1.51 ??
W (1/8 ????): 0.29/2.32 ??

#39
22:09, 19 авг. 2019
MemSpeed(64/128) by eDmk, 2019

Процессор: Intel(R) Core(TM) i7-7700K CPU @ 4.20GHz
Материнская плата: Z170-D3H-CF (Gigabyte Technology Co., Ltd.)

Свободной памяти: 27,96 Гб
Объем для тестов: 7,00 Гб
Кол-во циклов чтения/записи: 20

1. Запись Bytes: 29,04 Гб/с
2. Запись DWords: 29,23 Гб/с
3. Копирование DWords: 9,07 Гб/с
4. Копирование системой: 7,66 Гб/с
5. Запись QWords: 29,23 Гб/с
6. Чтение QWords: 16,20 Гб/с
7. Запись DQWords через кэш (WT): 12,55 Гб/с
8. Запись DQWords без кэша (NTH): 29,72 Гб/с
9. Чтение DQWords без кэша (NTH): 19,94 Гб/с
X. Запись DWords без кэша (NTH): 16,90 Гб/с
R. Скорость регистров общего назначения: 34,92 Гб/с
M. Скорость XMM-регистров: 69,58 Гб/с

Общий объем чтения/записи:  1 680,00 Гб

Задержки чтения/записи (64 бита):
R (1/8 байт): 0,11/0,86 нс
W (1/8 байт): 0,19/1,56 нс
#40
(Правка: 13:50) 13:48, 3 сен. 2019

В посте #0 обновил исходники и BIN (Небольшие дополнения и исправления).

#41
(Правка: 14:07) 14:02, 3 сен. 2019
MemSpeed(64/128) by eDmk, 2019

Процессор: Intel(R) Core(TM) i7-8700K CPU @ 3.70GHz
Материнская плата: Z370 GAMING M5 (MS-7B58) (Micro-Star International Co., Ltd.)

Свободной памяти: 13,81 Гб
Циклов чтения/записи: 30 x 3,00 Гб

1. Запись Bytes: 31,30 Гб/с
2. Запись DWords: 30,48 Гб/с
3. Копирование DWords: 11,16 Гб/с
4. Копирование системой: 10,65 Гб/с
5. Запись QWords: 33,87 Гб/с
6. Чтение QWords: 21,02 Гб/с
7. Запись DQWords через кэш (WT): 16,99 Гб/с
8. Запись DQWords без кэша (NTH): 43,97 Гб/с
9. Чтение DQWords без кэша (NTH): 27,97 Гб/с
X. Запись DWords без кэша (NTH): 17,35 Гб/с
R. Скорость регистров общего назначения: 35,78 Гб/с
M. Скорость XMM-регистров: 144,00 Гб/с

Общий объем чтения/записи:  900,00 Гб

Задержки чтения/записи (64 бита):
R (1/8 байт): 0,22/1,74 нс
W (1/8 байт): 0,35/2,80 нс

Нажмите Enter для выхода ...

Прошло более 9 месяцев
#42
19:46, 24 июня 2020
MemSpeed(64/128) by eDmk, 2019

Процессор: Intel(R) Core(TM) i7-9700K CPU @ 3.60GHz

Свободной памяти: 24,41 Гб
Циклов чтения/записи: 30 x 6,00 Гб

1. Запись Bytes: 28,24 Гб/с
2. Запись DWords: 28,66 Гб/с
3. Копирование DWords: 9,62 Гб/с
4. Копирование системой: 8,70 Гб/с
5. Запись QWords: 28,73 Гб/с
6. Чтение QWords: 17,17 Гб/с
7. Запись DQWords через кэш (WT): 13,95 Гб/с
8. Запись DQWords без кэша (NTH): 34,81 Гб/с
9. Чтение DQWords без кэша (NTH): 20,21 Гб/с
X. Запись DWords без кэша (NTH): 8,49 Гб/с
R. Скорость регистров общего назначения: 34,03 Гб/с
M. Скорость XMM-регистров: 137,98 Гб/с

Общий объем чтения/записи:  1 800,00 Гб

Задержки чтения/записи (64 бита):
R (1/8 байт): 0,09/0,71 нс
W (1/8 байт): 0,15/1,19 нс
#43
(Правка: 19:52) 19:51, 24 июня 2020

eDmk
> Зачем?
>
> Const создает в стеке копию, а так прям из переменной пишем.
> Я же ее не модифицирую, поэтому мне const не нужен. А если вам так удобно - я
> не против :)

Это на дельфях так чтоли? Ну я даже про дельфи не согласен. Const не должен создавать никакой копии. Копию создаёт передача по значению, а не по ссылке. Const это лишь слово соглашение между разработчиком и компилятором. Оно не вносит в асм код ничего. Исключение лишь для статических константных переменных, которые кладутся в блок read-only памяти.

#44
(Правка: 20:00) 19:58, 24 июня 2020

> кстати тут правильное использование префетча или нет?
> умножение массива векторов на матрицу тут.

Учитывая $30 в перфетче похоже что нет.

> у меня как то особой разницы незаметно, очивидно проц при такой операции сам
> юзает префетч.

Зависит от проца. Скорее всего у вас достаточно современный, и он автоматически (начиная с ivy вроде) умеет делать выборку, причем в обоих направлениях.

Страницы: 1 2 3 4 5 Следующая »
ПрограммированиеФорумОбщее