Войти
ПроектыФорумОцените

"Крестики нолики" + ИИ + [Собираю команду на шахматы] (3 стр)

Advanced: Тема повышенной сложности или важная.

Страницы: 1 2 3
#30
15:15, 20 июня 2019

cArmius
а можно это как то запустить, чтобы поиграть? мне кажется ИИ тут будет проигрывать ...

#31
19:28, 20 июня 2019

я это не доводил пока до такого состояния ))

#32
10:05, 21 июня 2019

cArmius
создай у себя ситуацию

X-O
-XX
—O

и выложи, плиз, скриншот со своими вероятностями ..

#33
(Правка: 10:41) 10:40, 21 июня 2019
TTT_AI_1 | "Крестики нолики" + ИИ + [Собираю команду на шахматы]

тут нужно пояснение - вероятность "выигрыша" в левой и верхней клеточке просто 0, потому что там либо проигрыш, либо ничья - даже если крестик "затупит"

а внизу есть ненулевая вероятность, потому что можно выиграть, если крестик будет ходить совсем неправильно

если смотреть на соотношения (выигрыши+ничьи)/(все)  (то есть не максимизируем шанс выиграть а минимизируем шанс выиграть противника), то мои крестики/нолики выбрали бы как раз-таки левую клеточку

ну а так да, они очень хотят походить в нижнюю клетку, туда где 0.22

#34
(Правка: 12:21) 12:04, 21 июня 2019

cArmius
> ну а так да, они очень хотят походить в нижнюю клетку, туда где 0.22
все верно, это не правильная оценочная функция .. /то о чем я и писал выше/

теперь вопрос к господам, которые тут заявляли что в крестиках все просто .. а какая функция будет правильной? или это уже сложнее, чем посчитать количество состояний в крестиках  ;)

#35
12:32, 21 июня 2019

tac
> какая функция будет правильной?
имхо, нет такой в крестиках ноликах.

во-первых, из-за того что есть ничьи
во-вторых, из-за того что у первого игрока огромное преимущество

надо смотреть хотя бы не на поле 3х3

#36
(Правка: 12:58) 12:44, 21 июня 2019

cArmius
неверно ) ну, у меня как бы диплом по ИИ /это к тому, что я уверен в том что говорю/ .. и основной принцип минимакса /и теории игр в принципе/ говорит о том, что ИИ должен предполагать наилучший ход противника /а не слабый аргумент, что противник может ошибится и вот тогда ../

по сути, я уже дал подсказку - такая функция не учитывает скорость наступления выигрыша .. конкретное решение я дам позже ... хочу чтобы побольше людей поспорило ;)

но и мое решение не самое лучшие /проявляется в 3d крестиках, где глубина поиска на 27 ходов, вместо 9 у 2d крестиков/, и вот когда все подтянутся я хотел бы обсудить лучшие .. но вначале нужно понять проблему .. по мне важную .. по сути речь о многопараметрической функции оценки, и нужно ли все сводить к одному числу

#37
(Правка: 13:13) 13:11, 21 июня 2019

tac
> ИИ должен предполагать наилучший ход противника
что такое наилучший ход? это лишь соответствие какой-то метрике

мой ии может сделать разные ходы в зависимости от метрики. хочу максимизировать вероятность выигрыша - один ход. минимизировать вероятность проигрыша - другой. Всё зависит от того, что мы просим у ИИ.


а вы видимо имеете в виду примерно такое:
на первом ходу можно выиграть с вероятностью 1/4, на втором - еще 1/4,...

тогда нужно ходить в такой ход, где будут суммироваться каким-то хитрым способом вероятности выигрыша и смотреть на максимальное

#38
(Правка: 13:30) 13:22, 21 июня 2019

cArmius
> что такое наилучший ход? это лишь соответствие какой-то метрике
наилучший тот, который сводит все шансы противника выиграть к минимуму, а свои к максимуму .. и не в какой то выбранной метрике, а скажем так в энергетическом поле реальной игры /которую для игр посложнее посчитать нельзя, но она есть .. и тогда используем эвристику упрощающую реальность/

метрика - это эвристика, а мы говорим о реальном положении дел .. крестики хороши тем, что мы можем все просчитать без ошибочно .. и понять как одна эвристика или другая соответствует реальности ..

поэтому ваша функция с эвристикой лишь на вероятность победы не соответствует реальности, а та о которой вы начали догадываться /с суммированием вероятностей/ будет соответствовать ... правда решение проще на самом деле, вероятности просто суммировать плохо ... там снова возможна ситуация, что сумма выигрышей будет перебивать вероятный проигрыш здесь и сейчас .. ключевое слово 'хитрым способом', а именно учитывая этот выигрыш можно получить сейчас или через 3 хода

по сути это классика - количество побед надо просто взвесить с разным весом в зависимости от глубины шага /скорости выигрыша/ .. ну вот уже почти все сказал ) вам осталось догадаться с каким именно весом )

#39
13:36, 21 июня 2019

ну, очевидно что 1/2^n, где n - глубина, - подходит

потому что сумма их на бесконечности даёт 1

Страницы: 1 2 3
ПроектыФорумОцените