Войти
ПрограммированиеФорумГрафика

Vulkan API (вышел!) (484 стр)

Страницы: 1483 484 485 486488 Следующая »
#7245
21:51, 15 сен. 2020

На свежих нвидиа примерно с 1.2.133 появилась device local host visible память на 256Мб.
Кто-нибудь уже затестил?


#7246
(Правка: 3:08) 3:07, 16 сен. 2020

/A\
> device local host visible память
Времено забанен в гугле, можно подробнее что это вообще такое?
Какая-то память в которую можно писать как в оперативную прямо из программы?

#7247
8:46, 16 сен. 2020

/A\
> На свежих нвидиа примерно с 1.2.133 появилась device local host visible память
> на 256Мб.
кстати, у АМД такая штука была с самого начала.

> Кто-нибудь уже затестил?
я затестил на dynamic VBO для спайн спрайтов. HOST_CACHED оказался быстрее. но у меня там был рандомный доступ. а может и чтение, не копал глубже.

Изображение

#7248
(Правка: 9:43) 9:40, 16 сен. 2020

Написал тесты на скорость загрузки в разные типы памяти.
В DeviceLocal как и ожидалось медленнее всего заливается.

+ Показать

Пробовал зациклить тест и тогда DeviceLocal | HostVisible оказывался сильно быстрее, похоже там отправка на шпу идет не сразу и при перезаписи часть выкидывается.

#7249
9:41, 16 сен. 2020

innuendo
> про мобилки не знаю, не работал - а на декстопах могу рассказать. на nvidia
> традиционно быстрее текстурные блоки, на amd геометрия - и как ты будешь тюнить
> ? раздельные кодепафы ?

Вот это "традиционно быстрее х" - это не профайлинг. А так - да, если это будет боттлнеком на платформе Х, то будет правиться отдельным кодом для этой платформы/железа.

#7250
2:01, 17 сен. 2020

Я думал это только на консолях. Там указатель выделяется аллокатором и подставляется в фреймбуфер.

#7251
3:18, 18 сен. 2020

ufna
> то будет правиться отдельным кодом для этой платформы/железа.

знаю код Unity/UE4/Cry, там есть отдельные фичи вендоров, типа DBT, но чтобы вот так под каждого вендора отдельный код могу вспомнить только DOOM3, и то только шейдера

#7252
9:44, 18 сен. 2020

innuendo
Кстати в  doom 2016 для амд включен асинк компьют и гпу оклюжн калинг, а на нвидии тогда еще не было асинков, но был хардаарный калинг.
Это считается?

#7253
9:50, 18 сен. 2020

/A\
> Это считается?
50/50 - там же не отдельный renderNV() renderAMD()?

#7254
10:29, 18 сен. 2020

/A\
> Кстати в  doom 2016 для амд включен асинк компьют
В смысле включен? Отдельная compute очередь? Или как?

#7255
10:31, 18 сен. 2020

Dimich
> Или как?

а как иначе?

#7256
10:35, 18 сен. 2020

innuendo
> а как иначе?
Я читал, что может не быть отдельной transfer очереди, про compute не слышал.

#7257
11:01, 18 сен. 2020

innuendo
> 50/50 - там же не отдельный renderNV() renderAMD()?

ну погоди, никто и не говорил об полностью отдельных рендерах. Разные вендоры - это куски кода с разными дефайнами, конфигами, воркэраундами и прочим. В анриле хватает nvidia-only и amd-only путей исполнения кода.

для мобил - дак вообще. Часто это скрыто конфигурацией фичей под тот или иной проц, где-то - воркэраундами и фоллбэками в коде RHI и шейдаков. такого что "вот тут рендер пайп чисто под X" - такого нет, но и не об этом речь.

под десктоп, скорее всего, это актуально в меньшей мере, но тем не менее - если у тебя внезапно в проекте дикая вендорозависимость, игнорировать это нельзя)

#7258
(Правка: 11:59) 11:04, 18 сен. 2020

ufna
> В анриле хватает nvidia-only и amd-only путей исполнения кода.

ой, таки сколько всего там примеров  nvidia-only и amd-only? да, они использут nvapi/ags

#7259
17:31, 18 сен. 2020

innuendo
> ой, таки сколько всего там примеров  nvidia-only и amd-only? да, они использут
> nvapi/ags

Честно говоря не считал, но они есть. Не мой профиль, в это другие ребята тыкались. Меня куда больше волнуют мобилки, где этого делается офигеть сколько, и на уровне движка, и на уровне проекта, если ты хочешь выжать максимум. Поэтому видеть отношение "да на других 50% рынка все норм" - мне очень странно :)) Если везде все норм - все ок, если у тебя боттлнек - ты будешь сидеть это и профайлить, потому что простите это деньги.

Страницы: 1483 484 485 486488 Следующая »
ПрограммированиеФорумГрафика