Флейм
GameDev.ru / Флейм / Форум / AlphaZero против Stockfish (3 стр)

AlphaZero против Stockfish (3 стр)

Страницы: 1 2 3
itmanager85Постоялецwww16 апр. 201821:23#30
entryway
> Для этого надо провести между ними матч, не? Я думаю, никто не знает, как себя
> покажет lczero на том же оборудовнаии, что и AlphaZero. Но вряд ли можно так
> просто взять и сравнить ботанов с DeepMind, с их бесконечными вычислительными
> ресурсами, с поделкой, которой месяц от роду и всего 5kk наигранных партий.

а сколько у AlphaZero наигранных партий ?

судя только по оценкам хода ниже - разница в мощностях гугла и  lczero несопоставима .. :D

По ходу партий Stockfish оценивала 70 миллионов позиций в секунду, Alpha Zero – 80 тысяч:

Alpha Zero на 4 TPU наигрывает за минуту столько же сколько и lczero за месяц (на 48 ядрах) ..

при том что тренировали Alpha Zero на куда более мощном оборудовании чем 4 TPU .. (4 часа)

Правка: 22 апр. 2018 3:41

FantargПостоялецwww17 апр. 201811:32#31
itmanager85
> а сколько у AlphaZero наигранных партий ?
Тут и там еще дело в том, что АЗ дрессировали отдельно, чтобы потом запустить процесс "по изучению" наигранных партий.
А в новой игрушке СФ там громадное число партий, который даже не нужно учитывать - это сравнимо с тем, как дать младенцу шахматы и пусть как-нибудь сам делает ходы.
Я посмотрел некоторые партии, там на игру в шахматы не похоже даже, грубо говоря (утрирую). Делают несколько ходов одной пешкой; не берут фигуры (пешка не взяла ладью, но зато другая пешка сделала пустой ход); повторные ходы фигурами (возврат на позицию: слон выбежал и обратно, затем вновь вернулся на стартовую клетку, затем вновь на позиции)... всё делают так, как дети, которым только-только рассказали о правилах.

itmanager85
> судя только по оценкам хода ниже - разница в мощностях гугла и lczero несопоставима .. :D
> По ходу партий Stockfish оценивала 70 миллионов позиций в секунду, Alpha Zero – 80 тысяч
Тут нужно понять одну вещь. Это не конкретно [оценивают позицию] (как многие понимают под этой фразой), это максимальная скорость "просмотра", без анализа, без оценки.
Грубо говоря (но не фактически): это - листать страницы большой книги, чтобы узнать количество этих страниц, не приступая к [точному] изучению, что в этих страницах.

Тут, чтобы как-то сравнить КПД, нужно все же дождаться более-менее каких-то официальных отчетов.
Матч-баттл не помешал бы, в конце концов.

Правка: 17 апр. 2018 11:34

entrywayПостоялецwww27 авг. 201811:29#32
We've probably achieved the goal of the project.

So, the goal of the project was to reproduce a0 and beat stockfish. Specifically SF8 and at similar search sizes as a0 and sf8. I chose to simulate this by fixing the nodes per move at multiples of 80k for Leela and 70m for SF8. I used net 11077, because it was the most recent when I started. I used no openings or egtb.

The 4 second simulation (320k vs 280m) had a record of +3-0=7. https://lichess.org/study/YT4nvKYD

I think we're there. I think if we ran the sf8 vs leela match on 60s/move a0 equivalent conditions, we would win by similar margins as a0. If anyone has some monster hardware, you're welcome to run longer simulations

As of this time, I consider this project a success.

Congratulations to team and contributors. On to bigger things.

https://groups.google.com/forum/#!topic/lczero/Rd03AbjCPPo
http://lczero.org/

Странно, что он не по одной партии сделал выводы, вместо десяти. По одной то уж наверняка можно было бы сказать, кто сильнее.

Правка: 27 авг. 2018 11:59

entrywayПостоялецwww14 сен. 201814:30#33
Достаточно давно в stockfish testing framework подключился китаец и на регулярной основе донатит сто и больше 8/16 ядерных компов. Наиграл уже 250 миллионов партий.
http://tests.stockfishchess.org/users

Теперь нашелся фанат и у LCZero. Сначала подключил к фреймворку двадцать Tesla V100, потом пятьдесят и теперь сто v100 — больше двух миллионов партий в сутки.
https://discordapp.com/channels/425419482568196106/42541948301685… 3064663113730

Правка: 14 сен. 2018 14:47

Страницы: 1 2 3

/ Форум / Флейм / Общее

2001—2018 © GameDev.ru — Разработка игр