ПрограммированиеФорумОбщее

Ускоряем рейтрейсинг (CUDA) (10 стр)

Страницы: 15 6 7 8 9 10
#135
1:45, 26 сен 2010

Вот такой боян:

1>ptxas info    : Compiling entry function '_Z10traceTS_20P6float4PN7gpuRayResult_tES3_Piijj' for 'sm_20'
1>ptxas info    : Used 50 registers, 4+0 bytes lmem, 12300+0 bytes smem, 76 bytes cmem[0], 4 bytes cmem[2], 4 bytes cmem[14], 12 bytes cmem[16]
1>ptxas info    : Compiling entry function '_Z9traceS_20P6float4PN7gpuRayResult_tEjj' for 'sm_20'
1>ptxas info    : Used 48 registers, 4+0 bytes lmem, 12300+0 bytes smem, 56 bytes cmem[0], 4 bytes cmem[2], 4 bytes cmem[14], 8 bytes cmem[16]
1>ptxas info    : Compiling entry function '_Z8trace_20P6float4PN7gpuRayResult_tEjj' for 'sm_20'
1>ptxas info    : Used 48 registers, 4+0 bytes lmem, 12300+0 bytes smem, 56 bytes cmem[0], 4 bytes cmem[2], 4 bytes cmem[14], 8 bytes cmem[16]
1>cuda_intersect_20.cu

Код без изменений от пред. версий (1.1, 1.2) компилируется для архитектуры sm_20. Регистров ровно в 2 раза больше - 48 и 50 вместо 24 и 25. С чем связано может быть? В обоих случаях модуль компилится с флагом -m64 т.е. для 64-битов.
Приходится ставить --maxrregcount=32

#136
13:28, 26 сен 2010

Ну это может быть связано с особенностями компилятора) maxregcount всегда надо ставить, так что все нормально.

#137
13:33, 26 сен 2010

Если компилю с -g -G (для memcheck например), то регистров не больше 30.
Флаги оптимизации не влияют: O0, O2, O3 одинаково - 50.

#138
13:39, 26 сен 2010

А что делают -g и -G ? Я так не помню, а смотреть в лом)

#139
13:41, 26 сен 2010

-g - отладочная инфа на хосте
-G - для девайса

#140
13:44, 26 сен 2010

Ну да, непонятно, баг наверное. Вообще используй лучше самую последнюю версию куды. Там же все лучше и лучше.

#141
13:50, 26 сен 2010

Может дело в новой 64-битной адресации для устройств 2.х ?

#142
13:51, 26 сен 2010

Всё последнее использую. Тулкит 3.2, сдк тоже. Девайс - gtx460

#143
14:18, 26 сен 2010

Я честно не знаю. Ставь maxregcount и все)

#144
14:32, 26 сен 2010

От платформы не зависит, линукс-вин одинаково.

Страницы: 15 6 7 8 9 10
ПрограммированиеФорумОбщее

Тема в архиве.