Imaginary unit
Ты очень понятно все высказал еще в #8922.
Вариант без staging буфера не будет медленнее (если ты один раз рисуешь динамик геометрию, после того, как ее поменял). Он проще.
Вообще, тебе еще поискать вариант без HOST_COHERENT_BIT нужно. Возможно сбило с толку, что ты его явно упомянул.
Еще ты можешь пошукать DEVICE_LOCL | HOST_VISIBLE память. На амд и современных нивида есть кусочек такой памяти (обычно 256мб).
Imaginary unit
> Эээ. Я про то, что я могу создать storage-буфер как device local. И копировать
> в него из staged-буфера, который host visible
я перепутал с интегрированной видюхой
HolyDel
> Еще ты можешь пошукать DEVICE_LOCL | HOST_VISIBLE память. На амд и современных
> нивида есть кусочек такой памяти (обычно 256мб).
О, спасибо.
HolyDel
> Еще ты можешь пошукать DEVICE_LOCL | HOST_VISIBLE память. На амд и современных нивида есть кусочек такой памяти (обычно 256мб).
На современных Nvidia вся память такая (см. Resizable BAR)
CatsCanFly
> На современных Nvidia вся память такая (см. Resizable BAR)
Современные - это какие? Моя 2070 Super только 224 Мб такой памяти имеет.
https://vulkan.gpuinfo.org/displayreport.php?id=12690#memory
Походу 3000 серия Нвидия с такой памятью. Ну, круто, чо.
Imaginary unit
> Походу 3000 серия Нвидия с такой памятью. Ну, круто, чо.
Нет, у меня на 3080 тоже ~224. Может нужно что-то в биосе крутить.
На 6600xt - 256mb.
Я бы рассчитывал на 200 мб для динамики для дискреток.
HolyDel
оно явно в BIOS включается, да. И не на всех чипсетах. У меня на z490 и RTX3070 все работает - все 8Гб DEVICE_LOCAL_BIT | HOST_VISIBLE_BIT | HOST_COHERENT_BIT - для этого надо было обновить фирмварь биоса и явно включить его
CatsCanFly
> У меня на z490 и RTX3070 все работает - все 8Гб DEVICE_LOCAL_BIT |
> HOST_VISIBLE_BIT | HOST_COHERENT_BIT - для этого надо было обновить фирмварь
> биоса и явно включить его
А смысл? Доступ к device_local памяти в несколько раз медленее, чем использование staging буфера.
/A\
> А смысл? Доступ к device_local памяти в несколько раз медленее, чем использование staging буфера.
Ну не нужно оттуда читать, да. А на запись (по моим тестам) она была не медленнее, если писать последовательно.
HolyDel
> А на запись (по моим тестам) она была не медленнее, если писать последовательно.
По моим тестам разница есть (это старые тесты на PCIe 2)
Как оказалось на мой древней мат. плате B450M-A все такие есть Resizable BAR, но 2000 серии Нвидия это явно не помогает :)
А в чем разница между TOP_OF_PIPE и ALL_COMMANDS?
И вообще есть вменяемая дока по синхронизации, пайплайн стейджам, аксес-маскам и т.д. для тупых тех то не втыкает в спецификацию? :)
Как в Вулкане сейчас быстрее всего будет рисовать простую травку (ту, что из двух-трех полигонов с натянутой на них текстурой травы)?
Обычный инстансинг или что-то иное будет побыстрее?
MikeNew
GPU Gems (1-2) уже не актуальны в плане техник?
https://github.com/CIS565-Fall-2017/Project6-Vulkan-Grass-Rendering