ПрограммированиеФорумГрафика

OpenCL (33 стр)

Страницы: 129 30 31 32 33 34 Следующая »
#480
11:27, 4 ноя 2010

FROL
> ИМХО сравнение такое не особо полезно. Это похоже на холивар Cи/Паскаль.
> Что быстрее Си или Паскаль? Ну такие тесты могут говорить только о текущем
> состоянии компилятора и драйвера.
> Если уж сравнивать то то всему спектру достоинств и недостатков технологий,
> включая "свежесть" драйверов.

Не согласен. Сравнения всегда полезны, поскольку позволяют лучше понять способы оптимизаций для разных железок/языков.
Холивары же бывают интересны, если их конечно ведут достаточно квалифицированные прогеры, чего впрочем о холиваре Cи/Паскаль сказать нельзя, поскольку, имхо, квалификация сищьников обычно на порядок выше.

#481
18:42, 17 ноя 2010

http://software.intel.com/en-us/articles/intel-opencl-sdk/

#482
21:56, 17 ноя 2010

SNVampyre
И че как? ты смотрел?

О. Федор
> имхо, квалификация сищьников обычно на порядок выше.
Все понятно, сразу ясно на чьей ты стороне будешь в этой войне :)

#483
22:31, 17 ноя 2010

FROL
> И че как? ты смотрел?
У меня нет процессора Intel. Рад, что теперь OpenCL есть под все платформы.

#484
1:10, 18 ноя 2010

SNVampyre
Посмотрю на i7, там 8 процессоров, наверное вещь стоящая.
Интересно, как там будет совместная работа гпу с цпу.

FROL
> Все понятно, сразу ясно на чьей ты стороне будешь в этой войне :)

Не, я в таких войнах не учавствую. C++ конечно мне больше нравится, но я не фанат. Если завтра появится лучший (шарп не предлагать!), то я перейду на него, но не вдруг, а хорошенько подумаю.

#485
18:01, 18 ноя 2010

Сегодня поставл оцл от интела. Пока предлагают только альфа версию. Компилируется, работает.
Определение того, на каком девайсе (цпу/гпу) будет выполнятся оцл код производится при созданиии контекста, в его свойствах. Для интела там например указывается ид интела. Таким образом, в принципе на любом компе можно под оцл задействовать любой девайс и таким образом заставить их работать паралельно.

#486
21:48, 25 янв 2011

http://www.geeks3d.com/20110125/amd-opencl-university-kit/#more-7673

#487
22:08, 25 янв 2011

innuendo
Не ну клево, да, но как-то поздновато. Кстати, если что то вот тут уже давно на русском есть:
https://docs.google.com/viewer?a=v&pid=explorer&chrome=tr… zY2&hl=ru

#488
22:37, 25 янв 2011

Если верить амдешним пайперам, то ключевым моментом при оптимизации будет такой подбор параметров, чтоб соответствовать

Occupancy - Threads
GPUs have hardware limitations on the maximum number of threads per work group
•  256 threads per WG on AMD GPUs
•  512 threads per WG on NVIDIA GPUs
NVIDIA GPUs have per-compute-unit limits on the number of active threads and work groups (depending on the GPU model)
•  768 nr 1024 threads per compute unit 8 or 16 warps per compute unit
AMD GPUs have GPU-wide limits on the number of wavefronts
496 wavefrnnts on the 5870 GPU (-25 wavefrnnts or~1600
threads per compute unit)

Естественно, для нв и амд эти параметры будут отличаться, в коде их можно будет специализировать дефайнами. Окажется ли это достаточным, чтоб код быстро работал на амд? - Возможно, локальная память (это эквивалент не локальной, а шедер памяти куда) в WG амд во всяком случае поддерживается.

Добавил. По стандарту опенцл локальная память может находится либо на чипе (как в жефорсах), либо выделена в сегменте глобальной (видимо так это сделано на амд). Последнее означает, что там действительно реализуется нечто похожее на пинг-понг и соответственно потребует совершенно другую стратегию оптимизации.

#489
23:27, 25 янв 2011

innuendo
> http://www.geeks3d.com/20110125/amd-opencl-university-kit/#more-7673
OpenOffice открывает белые листы, вместо презентаций :(

#490
0:16, 26 янв 2011

Spartan
Это очередная фича m$. Я поставил PowerPoint Viewer.

#491
3:26, 26 янв 2011

Spartan
> OpenOffice открывает белые листы, вместо презентаций :(

да, свежий office нужен - тут ни чем помочь не могу - либо обновление для старого, или как оно называется чтобы ppx читать

#492
20:53, 3 фев 2011

Поставил последние АТИшные дрова (11.1), поставил последний SDK 2.3, и на тебе:
> *** CAL version mismatch:
> This OpenCL build requires version 1.4.879, version 1.4.792 installed.

Они что, требуют какую-то девелоперовскую бету драйверов??? Оо
Кто-то сталкивался? а то что-то не эта фраза гуглится (

Добавлено:
Решил проблему установкой предыдущего SDK - 2.2

#493
11:09, 22 фев 2011

Всем привет

Решил не создавать новую тему, а задать вопросы тут.
Целевая видеокарта(ы) - HD5970(на работе) и HD5850(дома)

Пока вопросы общего плана.


Судя по инфе отсюда

Let’s plug some numbers to these definitions:

  • GeForce GTS 250: 16 compute units. The GTS 250 has 128 scalar processors then each compute unit has 8 OpenCL processing elements (128 / 16).
  • GeForce GTX 280: 30 compute units. The GTX 280 has 240 scalar processors then each compute unit has 8 OpenCL processing elements (240 / 30).
  • Radeon HD 5770: 10 compute units. We know a HD 5770 has 160 vec5 processors. 160 vec5 processors are equivalent to 800 scalar processors. Each compute unit has then 80 OpenCL processing elements (800 / 10).
  • Radeon HD 5870: 20 compute units. We know a HD 5870 has 320 vec5 processors. 320 vec5 processors are equivalent to 1600 scalar processors. Each compute unit has then 80 OpenCL processing elements (1600 / 20).
  • Radeon HD 5670: 5 compute units (or 5 SIMD engines). From here, we know a HD 5670 has 400 stream processors: 400 / 5 = 80 OpenCL processing elements.
  • A compute unit of a Radeon HD 5000 series has 80 processing elements (16 processing cores with 5 ALUs per processing core) and a compute unit of a GeForce has 8 processing elements.

    я правильно понимаю, что

  • на каждый Compute Unit есть своя локальная память? В HD5xxx уже ж появилась локальная память? Или эмулируется?
  • оптимальный размер ОЦЛ-ной WorkGroup будет как раз 16 work-item-ов, а оптимальная загрузка видяхи будет при 320-360 айтемов, разбитых на 20-25  групп (в зависимости от видяхи)
  • кернел нужно оптимизировать с учетом того, что его один "поток" будет обрабатываться 5-мя ALU ? (специфика суперскаляра)
  • ---------------------------
    И еще, если у кого есть, подкиньте пожалуйста пейперов по сабжу, а то что-то в гугле совсем ничего нет толкового

    #494
    11:34, 22 фев 2011

    *vmr
    > на каждый Compute Unit есть своя локальная память? В HD5xxx уже ж появилась
    > локальная память? Или эмулируется?
    > оптимальный размер ОЦЛ-ной WorkGroup будет как раз 16 work-item-ов, а
    > оптимальная загрузка видяхи будет при 320-360 айтемов, разбитых на 20-25 групп
    > (в зависимости от видяхи)
    > кернел нужно оптимизировать с учетом того, что его один "поток" будет
    > обрабатываться 5-мя ALU ? (специфика суперскаляра)
    Да, появилась. Да, потоковый процессор состоит из 5 ALU.
    Как эти вопросы относятся к OpenCL?

    Страницы: 129 30 31 32 33 34 Следующая »
    ПрограммированиеФорумГрафика

    Тема в архиве.

    Тема закрыта.