Войти
ПрограммированиеФорумОбщее

Что быстрее (10 стр)

Страницы: 15 6 7 8 9 10
#135
12:56, 21 июля 2009

IronPeter
> , что цена кеш промаха порядка 700 тактов,

Жесть! Убогие конслои :)

Такое ощущение что нормально под PowerPC - только на ASM, на C++ получается убого !


#136
12:57, 21 июля 2009

ну и всякие sin/cos, реализованные рядами на fpu - перфомятся зачастую лучше, чем прошитые в чип. За счет пайплайна и работы компилятора. В общем-то обычное дело. Конкретная мелкая фича неважна. Она не core.

#137
13:06, 21 июля 2009

IronPeter
А невыровненные данные сильно портят картину  ?

#138
13:13, 21 июля 2009

>А невыровненные данные сильно портят картину

В данном случае не портят. float на 4 байта выровнен, altivec не используется. Проблема единственно будет, когда sphere лежит на границе линейки кеша. Но оно редкое с вероятностной точки зрения. Хотя, конечно, может нароллиться, если как-то специально так их разместит. Тогда 2 кеш мисса вместо одного.

#139
15:02, 21 июля 2009

Z
> IRenderObj

а какой в среднем sizeof( IRenderObj ) и наследников ? Мне интересно :)

#140
15:29, 21 июля 2009

innuendo
> а какой в среднем sizeof( IRenderObj ) и наследников ?
Немного кстати, ~200 байт.
Вот IRenderOp толстъй, из-за некоторъх специфик - поддержка до 4-ех шейдеров одновременно в кадре, для каждой рендер операции. Байт ~500. Несколько кандидатов есть для оптимизации, бъло бъ время.
Примерно дабл-буфферинг трансформации в чем-то более компактном чем 4x3 матрица.

#141
15:31, 21 июля 2009

Z
А http://www.gamedev.ru/code/forum/?id=121340&page=9#m127 ?

#142
16:27, 21 июля 2009

10к бъло в одной тестовой сцене, реально 2.7к - 3к макс.

http://www.ag.ru/screenshots/tropico_3/287820#show

#143
16:43, 21 июля 2009

Z
> 10к бъло в одной тестовой сцене, реально 2.7к - 3к макс.

И после всех тестов останется 100-300 батчей ? 

аля simcity ? обожаю :)

Страницы: 15 6 7 8 9 10
ПрограммированиеФорумОбщее

Тема в архиве.