ПрограммированиеФорумОбщее

Ускоряем рейтрейсинг (CUDA) (9 стр)

Страницы: 15 6 7 8 9 10 Следующая »
#120
20:32, 17 апр 2010

А причем тут размер данных? Помоему ее смысл в скорости обмена данными.

#121
20:40, 17 апр 2010

Судя по мануалам, использование такой памяти увеличивает пропускную способность в два раза примерно. Но там нюансы, что чтение из такой памяти может быть эффективным лишь на небольшом круге процессоров.
http://www.gpgpu.org/forums/viewtopic.php?t=4798

#122
20:53, 17 апр 2010

The runtime also provides functions to allocate and free page-locked (also known as pinned) host memory.
Основной ее смысл по-моему, так это если что-то не помещается в обычную память, например 2Gb текстуры, которые киношники так любят.
И можно положить такие текстуры в обычную CPU-шную память. В этом смысл как мне кажется.
А то что она может просто увеличить пропускную способность памяти...ну не знаю, это где то написано?

#123
20:56, 17 апр 2010

А, блин, извини я невнимательно прочитал. Та это же пропускная способность CPU to GPU. Ну да, если у тебя в этом боттлнек то наверное.

#124
21:06, 17 апр 2010

FROL
Да вот ищу где ботлнек. При множественных проходах цп-гпу я уже проигрываю цп в 2 раза. Не выровненный доступ конечно присутствует, это одна причина (для железок _10,_11). Но может это и пересылки, сразу трудно вычислить.

#125
21:24, 17 апр 2010

Ты зря таскаешь данные туда-сюда, это не вариант вообще. Надо все на GPU считать.

#126
21:26, 17 апр 2010

>Надо все на GPU считать.
Этому мешают виртуальные функции.

#127
0:36, 18 апр 2010

Ботлнеком является именно пересылка данных, убедился воочию :)

#128
2:08, 7 июня 2010

FROL
Посмотрел на cuda-спеки для серии 400 и узрел там 32 тысячи регистров на мультипроцессор. Как думаешь это хорошо ? )

#129
13:04, 7 июня 2010

ну определенно хорошо)

#130
13:06, 7 июня 2010

Пользовался такими картами?

#131
13:10, 7 июня 2010

Ну я запустил пару раз рейтрейсинг на ней, работает у меня в 1.5-1.7 раз быстрее чем на аналогичной GTX285.
Но боттлнек мог сместиться в другое место. Дома не стоит поэтому более ничего не могу сказать. Хорошо бы погонять отдельные части алгоритма и на ней и потестировать разные подходы.

#132
13:19, 7 июня 2010

FROL
А по С++ возможностям на них что-то можешь сказать?

#133
15:49, 7 июня 2010

не знаю, пока ничего вроде нового не добавилось. Насколько я понял виртуальные функции так и не включили в куду 3.0(

#134
15:57, 7 июня 2010

хм, плохо если так. а вобще насколько помню они обещали исправиться в cuda 3.1.

Страницы: 15 6 7 8 9 10 Следующая »
ПрограммированиеФорумОбщее

Тема в архиве.