MrShoor
> Современную - это которая последние 10 лет существует? xD
А про мобильники где SM 4.0 нет, то есть отсутствуют геометрические шейдеры мы видимо забыли?
MrShoor
> А я не говорил что их не может быть равное количеству индексов. Но в нормальных
> моделях с нормальным UV картами (как слева в нульпосте) - вершин обычно меньше
> чем индексов.
ух ты, да, а 3 страницы срача это нечто иное.
MrShoor
> на котором не было Post T&L кеша, но такое сегодня можно найти разве что в
> музеях.
4/16 вершины на кеш это я уже писал. Эффективность которых можно легко проверить:
MrShoor
> Это легко проверить загрузив какую нибудь мега модель на старом железе. (c)
А в результате получаем не что иное как обработку трианглов на вершинном шейдере. Сколько раз мне еще это писать?
MrShoor
> Дада. Ты ржал, что типа assembly stage идет до вершинного шейдера, и типа я
> слился. А потом ой, оказывается там есть еще одна assembly stage. Epicfail
Походу тебя бомбит уже, от того что начинает доходить о том что я изначально писал, но хочется до последнего превратить все в фарс.
foxes
> А про мобильники где SM 4.0 то есть отсутствуют геометрические шейдеры мы
> забыли.
Только на современных мобильниках, где SM 4.0 отстутсвуют все равно 2 разные stage. Отдельно primitive assembly stage, отдельно rasterizer stage.
> 4/16 вершины на кеш это я уже писал. Эффективность которых можно легко
> проверить:
Да, я даже графики приводил. Тут: https://zeuxcg.org/2017/07/31/optimal-grid-rendering-is-not-optimal/
Где просто почти 2x разница в производительности.
Та самая разница, про которую ты писал, что её нет.
MrShoor
> Та самая разница, про которую ты писал, что её нет.
Воооо, а теперь я пишу что ее нет? Писал, писал что максимум что можно выжать это два раза, а теперь нет. О как. Да, тебя реально бомбит.
MrShoor
> все равно 2 разные stage
Они изначально разные, просто ты упорот. А из недосказанности начинаешь делать выводы.
foxes
MrShoor
Чуваки, вам надо просто загрузить константы за один вызов. И вот у кого быстрее - тот и прав.
g-cont
Да он просто к словам цепляется. Мы говорим об одном и том же.
foxes
> Мы говорим об одном и том же.
Да, об одном и том же, только противоположные вещи. Ты говоришь что разницы в производительности нет, ибо видеокарта работает с отдельными треугольниками в вершинном шейдере. Я говорю, что разница есть, потому что в вершинном шейдере нет треугольников, а есть вершины, и результат для вершин может кешироваться, а одну вершину могут разделять несолько треугольников.
MrShoor
ох... Вот самому не надоело одно и то же с начало начинать?
MrShoor
> Ты говоришь что разницы в производительности нет, ибо видеокарта работает с
> отдельными треугольниками в вершинном шейдере.
Да, потому что весь набор вершин, который проходить через input assembly это и есть все треугольники, и в основных случаях с моделями кеш результатов не дает, и на вершиный шейдер идут все трианглы целиком. И весь твой срачь вокруг того, что такого случая не бывает.
А то что дает это 1% максимум.
foxes
> ох... Вот самому не надоело одно и то же с начало начинать?
А тебе надоело?
MrShoor
> А тебе надоело?
А фигли ты наезжаешь.
foxes
> А фигли ты наезжаешь.
Так а фигли ты тут ошибочными знаниями учишь других?
MrShoor
> Так а фигли ты тут неверной информации учишь других?
Какой такой неверной? Давай сфантазируй.
foxes
> Какой такой неверной?
Вот этой:
MrShoor
> На этапе фрагментного шейдера
Все так и есть, на фрагментный шейдер уже идет отдельный триангл, пиксели которого и рестаризируются. О чем ты сам и писал, после Primitive assembly.
MrShoor
> отдельных случаях вершинного шейдера
Отдельный случай описан, когда кеш не имеет посчитанных вершин, ты тоже такого случая не отрицаешь.
MrShoor
> это все равно отдельные треугольники.
В результате так и есть, без отработки кеша, и на рестаризатор поступают отдельные трианглы.
MrShoor
> clc, не на каждом же железе. Скорее тут больше геометрический шейдер будет
> давать нагрузки, а в отсутствии такого элемента конвейера в железе, вершинный
> шейдер обрабатывает вершины отдельного треугольника. Это легко проверить
> загрузив какую нибудь мега модель на старом железе.
Да, у меня такая видеокарта без геометрического шейдера. 16 вершин в кеше ничего не дают, а с введением геометрических шейдеров механика расширилась, на моей практике.
foxes
> 16 вершин в кеше ничего не дают
Они много чего дают. Если бы они ничего не давали - никто бы не делал этот кеш.
foxes
> а с введением геометрических шейдеров механика расширилась, на моей практике.
Этот кеш работает вне зависимости от того есть у тебя геометрический шейдер или нет.
Никак чувство собственной важности покое не дает? Мне уже приводили пример того как можно выиграть в производительности за счет столь малого кеша. А видеокарты с кешом в 16 вершин и геомтрическим шейдером мне тестировать не приходилось. Насколько я знаю там уже используется память, а не просто кеш.
Тема в архиве.