Программирование игр, создание игрового движка, OpenGL, DirectX, физика, форум
GameDev.ru / Программирование / Форум / Бредовое поведение драйвера.

Бредовое поведение драйвера.

Страницы: 1 2 Следующая »
sanПостоялецwww24 фев. 20186:15#0
Я тут приобрел Titan V. И решил воткнуть его в качестве основной карты в комп, где раньше стояли Titan Х(p) и AMD R9. Карты решил не выкидывать, а просто добавить еще одну, благо свободный слот был. Короче сдвинул карты вниз а на первый слот воткнул новый Титан. Потом начались странные глюки - мои старые карты не находились в системе. Вместо них был микрософтовский драйвер по умолчанию. Прошерстил интернет, нашел совет как это исправить (типа удалить драйвер и вместо него поставить правильный). Денек пое..лся и система заработала! Т.е. работало все, кроме моей программы.. А эта программа хитрая, она шерстит адаптеры и рендерит картинку на всех найденных картах, дабы повысить производительность. Причем учитывает их скорость и сообразно этому раздает задачи. Да еще делает это в разных тредах (все на DX12 разумеется). Раньше она работала на Титане X(p) и R9 - все было отлично, Титан тянул где-то 60%, AMD - 40% и я был жутко доволен.  На одной карте тоже работало, тогда панель GUI рендерилась на встроенном микрософтовском эмуляторе. А с новым Титаном - хрен вам... Апликация падает, причем с бредовой диагностикой (кому интересно и кто знает DX12 - могу показать). Даже если я задаю использовать старую конфигурацию (картинку рисуют Титан X и R9, а весь GUI - микрософтовский эмулятор), то падает все равно. И даже если задаю одну карту (любую), а GUI на любой другой. Упорно падает.
Три дня ковырялся - ничего понять не могу. Но вдруг все заработало! А потом опять перестало... Вобщем нашел, что если я вызываю Afterburner а потом его закрываю - то все ОК (надо его закрыть, поскольку с открытым все равно падает). EVGA Precision таким свойством не обладает. После Afterburner любая конфигурация работает на ура. Что это за дела, кто может что-то умное сказать? Где глюк - в дровах или в системе? Переустанавливать системо очень не хотелось бы.... Там мегатонны софта, на переустановку уйдет неделя а то и больше.

Пара слов про Titan V: ну это вообще-то монстр... И дело не в том, что по производительности в шейдерах (остальное не совсем дело карты) он быстрее Titan Xp на 75%. Поначалу я решил, что в два раза, но это я погорячился. Но 75% - железно. Главное то, что он имеет 2560 double коров (в добавок к 5120 обычным)! Про тензорные умолчу, так как не понимаю пока как их использовать. Но поскольку я его разогнал до 2GHz, то на 2560 корах он может считать 3D фракталы в реальном времени (10-20фпс), тогда как Mandelbulber 3D тратит на это несколько минут. Разница больше чем на два порядка. У меня есть Titan Black, но там в три раза меньше двойных коров и частота ниже в 2 раза, т.е. он в 6 раз медленнее даже без учета оптимизации железа (реально - в 10-15 раз медленнее). А это была самая быстрая карта для вычислений с двойной точностью! Вангую - когда мы доберемся до настоящего VR (когда хедсеты будут тянуть 4К на глаз), без двойных коров будет никуда...

Вот скриншот, кому интересно:
Titan V | Бредовое поведение драйвера.

Правка: 24 фев. 2018 8:17

Андрей5000Постоялецwww24 фев. 201812:05#1
На каком вызове падает то?
ZabПостоялецwww24 фев. 201813:23#2
Блока питания хватает? Карты то прожорливые, просаживает на пике нагрузки - что-нибудь сбрасывается.
По идее, они верещать должны начинать, сигнализацию ставили на этот случай, но может при нескольких видяхах она не срабатывает, не всегда срабатывает и при одной видяхе.
Iron ManПостоялецwww24 фев. 201813:56#3
Zab
У меня когда блока питания начало не хватать, компьютер тупо вырубался.

Правка: 24 фев. 2018 13:56

sanПостоялецwww24 фев. 201818:10#4
1. Падает на Present(), причем ругается на какие-то левые ресурсы без назавний, хотя все свои я именовал. Короче полный бред. Самое главное, что после танца с бубном (включения и выключения Afterburner) все нормально работает.
2. Блока хватает.  Ну и Afterburner к блоку питания отношения не имеет.
Это явно что-то не то в операционке....
sanПостоялецwww24 фев. 201819:06#5
У меня есть смутное подозрение, что тут проблема с недостатком PSI линий. На моем процессоре их 16. Три карты и 4х слотовый SATA адаптер. В системе стоит 10 дисков. Проблемы с загрузкой начались сразу после установки третьей карты - система перестала грузиться, а иногда и на биос не выходила.  Поставил принудительно конфигурацию 8-4-4 и вынул адаптер, а заодним отключил все диски кроме системного. Стало грузиться. Но почему-то отрубился звук. На звук пока положил, у меня в качестве одного из мониторов стоит 4К телевизор, там звук есть. Но началась чехарда с неправильно конфигурированными адаптерами, о чем я писал в первом посте. Наконец удалось все настроить но тут обнаружилась эта странность с падением моей программы. (Кстати встроенного звука так и нет и диски, подключенные через адаптер, пришлось пока убрать).
Вобщем система какая-то нестабильная. Возможно это из-за недостатка линий. Или что-то кривое в мазеборде (MSI Z97A SLI). Не знаю. Моя программа просто использует все ресурсы и на ней эта нестабильность вылазит, но дело не в программе. Что-то вообще кривое. Может стоит сменить процессор на 7800X (там 28 линий), но это влетает в полторы тысячи (придется еще сменить мазеборду и пямать) и после 3000 баксов на видеокарту это уже перебор... Да и жалко выбрасывать вобщем то неплохое железо.

Правка: 24 фев. 2018 19:10

ZabПостоялецwww24 фев. 201821:35#6
Все слоты под карты PCIE? Все широкие? Видяхи то только в них должны вставать, по идее.

А вообще, такое поведение было характерно для мамок на чипсетах от via. Думал, оно уже все в прошлом, больше таких не делают.
Как-то подозрительно мало что слотов под карты, что встроенных SATA. Обычно этих слотов уйма, от души пихают, у меня карточка хз какого древнего года, так и там SATA-слотов 14.

sanПостоялецwww25 фев. 20181:07#7
Да ничего подобного, на 97 серии может быть только шесть SATA слотов, больше процессор не поддерживает. Иногда добавляют еще 2, но для них стоит отдельная микросхема. У меня как раз такая, там 8 слотов SATA и три PCIe. Вот она: https://ca.msi.com/Motherboard/Z97A-SLI-Krait-Edition.html
А где вы видели 14 слотов мне очень интересно. Я искал новую мамку на замену этой, так нашел только максимум с 10 слотами. Причем это на самой последней 299 мазеборде, где LGA 2066. Похоже больше просто не бывает.

Слоты PCIe у меня как на обычной SLI мамке. Разведены 16, 8 и 4. Используются соответственно 8, 4, 4. На большее линий не хватает. Если все же перейду на 299 серию и 7800 процессор, то там можно будет сделать 8,8,8 и еще останется 4 линии запаса. Если решусь влететь еще в полторы тысячи, то тогда куплю вот эту: https://www.msi.com/Motherboard/X299-XPOWER-GAMING-AC.html
На ней мои 3 карты легко встанут, 10 SATA и еще можно помпой и вентиляторами управлять по человечески, т.е. не от температуры CPU, а в зависимости от температуры воды, что намного правильнее. Но пока я еще не отчаялся как-то зафиксать проблему на имеющемся железе.

Правка: 25 фев. 2018 1:10

ZabПостоялецwww25 фев. 20182:42#8
+10 слотов SATA дает RAID-контроллер (8+2). Их можно использовать и все по отдельности, не объединяя в RAID.
Одно время RAID лепили чуть ли не на все мамки. Сейчас перестали?

Правка: 25 фев. 2018 2:45

sanПостоялецwww25 фев. 20183:33#9
Ну дали тебе 6 портов, вот и делай на них RAID. Встроенных я давно не видел, по крайней мере с тех пор как PCIe разьемы появились. У меня стоит внешний RAID контроллер, я просто назвал его адаптером. У меня он четырехпортовый, но втыкается в PSI слот. Слот-то есть, но похоже он отьедает линии PCIe. У меня есть и другой адаптер, тот уже прямо с PCIe разьемом (х4), но свободных разьемов (как и линий) на моей мазеборде уже не осталось. Да фиг с ним с SATA, мне бы разобраться, почему без танцев с бубном программа падает... Что такое делает афтербурнер при закрытии? Достаточно один раз его просто вызвать и закрыть ничего не делая, после чего программа перестает падать. Т.е. он что-то меняет в системе. Значит с виндой что-то не то, как-то надо ее сконфигурировать. Ну и вообще наблюдается общая нестабильность, часто комп не запускается, причем висит с черным экраном где-то на биосе. Со второго раза как правило запускается. хз что там творится и главное не пойму на что грешить...

Правка: 25 фев. 2018 3:48

ArohaПостоялецwww28 фев. 20189:24#10
На вашем месте я бы обратился на форум к майнерам. У них наверняка большой опыт в решении подобных проблем.
По симптомам похоже на питание, Afterburner, возможно, фиксирует максимальную частоту или еще хз что, поэтому карты заводятся. Я бы попробовал на жесткие диски подать питание отдельно. Или понизить частоту всего на свете.

Дальше можно поодключать в биосе все устройства, посмотреть клиническую картину, может какие траблы с прерываниями, однако сомневаюсь...
Последнее подозрение - на память, тут хз как проверять.

Если система - десятка, то у нее на редкость нестабильное видео-ядро (относительно) (в сравнении с семеркой и восьмеркой). Но, как понимаю, менять систему - не вариант. Поставьте временно на свободный жесткий, не снося старую...

Но я бы думал на питание.

Правка: 28 фев. 2018 9:24

sanПостоялецwww28 фев. 201817:54#11
>На вашем месте я бы обратился на форум к майнерам.
Майнеры не пишут программы, они их юзают. И там нет Present'а не котором программа падает. Я для интереса запускал майнинг на этой системе - майнит как зверь, 140Mh/s. Но мне надо что бы все три карты рендерили картинку, т.е. там работает связка карта-монитор. Шейдер отрабатывает, затыкается все при попытке вывести на экран.

И не похоже это на питание... Блок 850W но дело даже не в этом, а в том, что даже если настроить программу для работы на одной карте (вторая только рисует GUI - там нагрузка 0, а третья вообще не используется), происходит то же самое. Вся система при этом потребляет 300W. После aftertburner можно задействовать все 3 карты, потребление подскакивает до 700W, но все нормально работает. Явно что-то не то в работе драйверов. Я все же грешу на недостатой линий.

Ладно, я сдаюсь. Придется покупать новую мазеборду и весь прочий зоопарк. Все равно то, что у меня сейчас (Z97, 4790 и DDR3) уже устарело.

snake32Постоялецwww1 мар. 201814:13#12
san
> Я тут приобрел Titan V
OpenCL какой держит? По прежнему 1,2?
snake32Постоялецwww1 мар. 201814:41#13
Где-то читал что в Titan V на уровне драйвера залочена "мультикарточность". Иначе титан будет конкурентом с теслы.
Если физически вынуть все другие карты, или хотя бы все nVidia?
Может проблема в этом?
sanПостоялецwww1 мар. 201818:02#14
snake32
> OpenCL какой держит? По прежнему 1,2?
Без понятия. А как это проверить, Nvidia Control Panel про OpenCL ничего не рапортует.

snake32
> Если физически вынуть все другие карты, или хотя бы все nVidia?
Вынуть карты не имеет смысла, поскольку проблема именно в работе мультиадаптерного приложения с отрисовкой в разных тредах на разных картах. Все чинится однократным вызовом afterburner'а, что что говорит о каких-то нестыковках в драйверах на очень низком уровне. Виноват ли в этом Titan V или проблема в чем-то другом, я не знаю. Заменить Titan V на какую-нибудь другую карту, для проверки, очень сложно, поскольку у меня водяное охлаждение.

Страницы: 1 2 Следующая »

/ Форум / Программирование игр / Графика

2001—2018 © GameDev.ru — Разработка игр