ПрограммированиеФорумОбщее

Ускоряем рейтрейсинг (CUDA)

Страницы: 1 2 39 10 Следующая »
#0
18:21, 27 ноя 2009

Интересует, кто работал с ocl, хочется сравнить с cuda - хуже/лучше. Вот видел доки про kd-tree на gpu (cuda), кто что знает про ocl в этом плане поделитесь.
Посмотрел несколько топиков об OpenCL на nvidia, многие утверждают что ocl просаживается в 2-6 раз на разных алгоритмах в сравнении с cuda на железе nvidia.

#1
20:44, 27 ноя 2009

Не замечал. Скорость такая же. Даже лучше, но это связано с тем, что под пришлось обновить дрова, а новыми и куда оказалась чуть быстрее, на том же железе.

#2
20:47, 27 ноя 2009

О. Федор
На какой платформе (ось) ? Версию дров тоже хотелось бы узнать. Если не секрет какой алгоритм тоже.

#3
21:26, 27 ноя 2009

gf 8800 gt,
cudadriver_2.3_winxp_32_190.38_general.exe
gpucomputingsdk_2.3a_win_32.exe

Алгоритмы сравнивал аналогичные, из куда и оцл сдк. В основном по скорости передачи данных и арифметические, типа перемножения матриц.

#4
22:25, 27 ноя 2009

_vasa_
> многие утверждают что ocl просаживается в 2-6 раз на разных алгоритмах в
> сравнении с cuda на железе nvidia.

Я думаю они судят по демкам в СДК, которые используются ОпенГЛ... Там (в этих конкретных примерах) нет интеропа с ГЛ в этих демках, соответственно работает в разы медленее...

#5
8:01, 28 ноя 2009

Executor
Еще видел утверждения что планировщик ocl не плюс к скорости, а также то что ocl это всего навсего слой над cuda (у нвидии).

#6
8:07, 28 ноя 2009

Где бы глянуть про применение ocl для distributed? Например как раскидать ocl-задачу на несколько машин.

#7
8:35, 28 ноя 2009

_vasa_
> Еще видел утверждения что планировщик ocl не плюс к скорости

Я не в курсе что за планировщик...

> а также то что ocl это всего навсего слой над cuda (у нвидии).

Типа того...

> Где бы глянуть про применение ocl для distributed? Например как раскидать ocl-задачу на несколько машин.

Можно попробывать найти подобное на КУДА, потому как там шибко разницы особой нет, принцип примерно везде одинаков, только синтаксис чуток другой...

#8
8:40, 28 ноя 2009

Принцип один и тот же, отличий совсем мало - кстати одно из них - это свой (ocl) планировщик задач :) и то что код компилится "на лету". В cuda не делал расп. вычислений ниразу, как на несколько видюх раскидать знаю, а в ocl вроде бы как поддержку Cell обещали.

#9
15:33, 28 ноя 2009

Что об amd известно? Как там дела с ocl обстоят, нужно точить проги под их архитектуру или подобие с нвидией сохраняется?

#10
18:01, 28 ноя 2009

Ничего точить не надо, иначе смысл ОЦЛ теряется...

#11
18:02, 28 ноя 2009

Точить нужно под архитектуру, а не под вендора.

#12
18:04, 28 ноя 2009

Suslik
Вот я про то. Не подскажешь, где можно почитать об архитектуре видюх amd (аналогично cuda) ?

Executor
Архитектуры разные и точить видимо нужно, или схожесть есть? :)

#13
18:06, 28 ноя 2009

Известные недостатки cuda (для алгоритма kd-tree) - отсутствие стека и нехватка регистров gpu. В мире амд я полный ноль, поэтому интересует что и как у них.

#14
18:23, 28 ноя 2009

У них регистровый файл больше, соответственно ситуация чуть получше. Но у AMD хуже текстурник => kd-tree для них скорее всего хуже чем BVH.
А в CUDA стек не проблема сделать, это как раз неправда.

Страницы: 1 2 39 10 Следующая »
ПрограммированиеФорумОбщее

Тема в архиве.