Флейм
GameDev.ru / Флейм / Форум / AlphaZero против Stockfish

AlphaZero против Stockfish

Страницы: 1 2 3 Следующая »
=A=L=X=Постоялецwww21 дек. 201712:44#0
Ребят, сюда!

Последний пост от Fantarg:

itmanager85
> тебе ещё один график (Figure 2) привести в котором "Seconds per Move" по оси абсцисс - от 40 ms до более чем 10 c ?
Читай мое прошлое сообщение, на прошлой странице прошлого, я там товарищу пояснил, что он не так понял эти рисунки. И о чем была речь в них!
xma просто сам не понял, что там (в документе пдф) за фраза была "с 40мс мышлением"!!! Авторы ссылались на публикацию (упоминали визуальные(!) тесты прогона на замер Эло), где говорили, что алгоритм АЗ с ее альфа-бетта-отсечением лучше работает, чем у СФ алгоритмы анализа [с 40мс мышлением]. И это видно на картинках двух, где показано, что это линейные алгоритмы НЕ ТАК ЭФФЕКТИВНЫ, как аппаратные мозги АЗ, когда заваливает за 1 секунду обдумывание на ход (там нарисовано 10 в степени минус 1 до 10 в степени 1)

itmanager85
> а минуту на ход по твоему СФ (Stockfish) чем занимается если не анализом ходов?
Я ранее и об этом указал, что движок БЕЗ АНАЛИЗА может делать кучу разный манипуляций. Перечитай внимательнее, прошлое мое сообщение. Выделенное время (образно) на алгоритмы сравнения, чтобы делать себе пометки, обрабатывать все разные другие вводные и обработанные данные (когда движок оценивает позиции, а это не анализмышления = специально вместе напишу), он разные деревья как-то должен обрабатывать, чтобы выделять кандидатов на ход.
Вот я писал, что я и указывал в прошлом:

(так и в параметрах движка - Engine Parameters - указано: Thinking Time Integer / to analyze in milliseconds / Default: 20, Min: 0, Max: 5000)

itmanager85
> нет там никакой "мощность алгоритма анализа" отдельного по времени от "Seconds per Move" .
А ты в курсе, что на картинках нарисовано? Там линии замеров по рейтингу Эло. У СФ проверяли настройку "с 40мс мышлением", а у АЗ проверяли эффективность альфа-отсечение.
Сами графики (картинки) и выводы (в тексте) взяты из ежегодного сборника (я ранее писал, что это журнал).

kiparУчастникwww21 дек. 201712:46#1
да-да, всё интересно узнать что же Стокфиш делает оставшуюся 1 минуту кроме 40мс, но в новостях спрашивать неудобно.
FantargПостоялецwww21 дек. 201712:51#2
Движок БЕЗ АНАЛИЗА (анализа, как термин прописанный в параметрах движка - "Thinking Time") может делать кучу разный манипуляций.
Это указано в Engine Parameters
Thinking Time Integer / to analyze in milliseconds / Default: 20, Min: 0, Max: 5000
Там еще есть вот такие основные настройки:
Contempt; Min Split Depth; Threads; Hash; Ponder; MultiPV; Move Overhead; Minimum Thinking; Slow Mover; ProbeDepth; MoveRule; ProbeLimit...
entrywayПостоялецwww21 дек. 201712:56#3
О чём там спор хоть был, кто-то понял? Как можно было бы усилить SF в матче против Альфача? Так я напишу:

  • Взять dev версию, сразу +40 Эло.
  • Выделить больше памяти под хэш-таблицу оценок позиций. Одного гигабайта мало для 64х потоков, заполнится очень быстро.
  • Прописать путь к 6-фигурнум окончаниям (Syzygy Bases), еще плюс 10 Эло.
  • Использовать дебютную книгу, хотя бы минимальную на 2-4 хода.
  • Ну и играть не строго по минуте на ход, а с каким-нибудь нормальным контролем. Движок в состоянии разобраться на какой ход хватит нескольких секунд (обмен ферзями, например), а над каким стоит призадуматься минут на десять.

Но всё это скорее всего не поможет, если DeepMind хоть как-то заинтересованы в развитии.

Правка: 21 дек. 2017 13:34

FantargПостоялецwww21 дек. 201712:58#4
kipar
> что же Стокфиш делает оставшуюся 1 минуту кроме 40мс,
Движки в режиме стандартном (когда дают время на партию или время на 40 ходов), выделяют и распределяют время на свои алгоритмы.
Прежде всего, движок должен увидеть и обозначить позиции, он их оценивает. В 1 секунду СФ оценивает 70млн позиций.
Оценить - это не тот термин "анализ", которые и есть "Thinking Time". Назначить разные деревья (потоки) - это не анализ.
Присвоить значения на каждый ход в дереве - это не анализ. Раскидать ходы кандидаты в каждом дереве - это не анализ.
Сравнительное мышление (анализ) - это и есть выделенное время, чтобы отсекать, сравнивать все то, что оценили и взвесили). Это я как мог, не программист движков, рассказываю.
+ Показать

Правка: 21 дек. 2017 13:06

FantargПостоялецwww21 дек. 201713:11#5
entryway
> Но все это не поможет скорее всего.
Шипов (гроссмейстер) некоторые позиции из сыгранных партий анализировал дома.
Естественно, движок другие оценки дал позициям. То есть, в нормальных условиях для движка (любого движка) тесты будут другими, в пользу шахматных движков.
Ну, пока не разгонят АЗ по самое не балуйся. Хотя и тогда, еще не известно, что будет (движки тоже не одним днем живут).
upd граммар

Правка: 21 дек. 2017 13:26

FantargПостоялецwww28 дек. 201720:22#6
Сейчас будет немного разоблачений о пиаре.
Вот комментарий гроссмейстера Шипова:
Изображение

А вот результаты сыгранных всех партий, обратите внимание две таблицы:
Изображение

Изображение

Первая таблица это результаты по партиям сыгранных АЗ за белых, а вторая таблица - результаты по партиям сыгранных СФ за белых. В чем думаете подвох? В том, что в документ, который СМИ нашли на arhiv_org, это составной документ на основе материалов по экспериментам, которые проводил Гугл. Гугл не предоставил никаких отчетов, это для сведения (файл вытащили СМИ с arhive_org (где не проводят никакой компетентной проверки).
Так вот, в нем (файл с архива) перерисовали таблицу, изъяв из двух таблиц по одной строке 25 25 0 и 3 47 0, но в отчете текст гласит, что из 100 сыгранных партий, АЗ не проиграл ни одной! Хотя видно четко из двух таблиц, что было сыграно 1300 партий, и что АЗ проиграл 5 партий (за белых), а СФ проиграл 19 партий (за белых), но(!) в строке 3 47 0 - это игры СФ за белых, где "3" - это его победы, а не победы АЗ, которые приплюсовали (25+3) к 28 победам АЗ из сыгранных 100 партий!!! Сравните, как эти две разные строчки перенесли в эту сокращенную таблицу:

+ Показать

Кто писал текст, совершил ошибку, приняв показания как показания итогов со стороны АЗ:)
К чему это я?
Неплохие результаты, при том, что по сути СФ дал большую фору титану АЗ

+ Показать
So overall it is around:
32 GB vs 1GB
720 TF vs 2.9TF

itmanager85Постоялецwww28 дек. 201720:41#7
Fantarg
> Сравните, как эти две разные строчки перенесли в эту сокращенную таблицу:
>
+ Показать

> Кто писал текст, совершил ошибку, приняв показания как показания итогов со
> стороны АЗ:)

может хватит клоунить - в научной статье от DeepMind те же данные .. ;-)

https://arxiv.org/pdf/1712.01815.pdf

Fantarg
> В чем думаете подвох? В том, что в документ, который СМИ нашли на arhiv_org,
> это составной документ на основе материалов по экспериментам, котокарые проводил
> Гугл. Гугл не предоставил никаких отчетов, это для сведения (файл вытащили СМИ
> с arhive_org (где не проводят никакой компетентной проверки).

это бред - читай научную статью от DeepMind выше, никто ничего не выуживал - эта картинка (вышеуказанная) из официального источника от DeepMind ..

Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

David Silver,1∗ Thomas Hubert,1∗Julian Schrittwieser,1∗Ioannis Antonoglou,1 Matthew Lai,1 Arthur Guez,1 Marc Lanctot,1
Laurent Sifre,1 Dharshan Kumaran,1 Thore Graepel,1Timothy Lillicrap,1 Karen Simonyan,1 Demis Hassabis1

1DeepMind, 6 Pancras Square, London N1C 4AG.

∗These authors contributed equally to this work.

Правка: 28 дек. 2017 20:45

FantargПостоялецwww28 дек. 201720:58#8
itmanager85
> может хватит клоунить - в научной статье от DeepMind те же данные .. ;-)
Это не научная статья, это составной файл, в который собирали из разных материалов по эксперименту.
Этот файл вытащили из arhive_org, я о нем и пишу!

> никто ничего не выуживал - эта картинка (вышеуказанная) из официального источника от DeepMind
Эта картинка - перерисованная таблица, которая содержит две разные строки из других двух таблиц, которых я и предоставил. Что не понятного?

Тот, кто писал текст в документе (1712.01815), либо сознательно обманул, либо несознательно, когда трактовал результат по 100 партиям. Эти сто партий, всего лишь игры из 1300 проведенных, которые указаны в строке "none" (см. таблицы).

"None" - это не_тематические 50+50 партии. В этой строке None указано 25 25 0 итог игр за белых у АЗ, и из второй таблицы строка None, где указано 3 47 0 итог игр за белых у СФ. То есть, взяли партии (50+50) из таблиц и перенесли результаты в другую таблицу, которую выдали как текст всего 100 партий, но при этом допустили ошибку, когда 3 победы за белых у СФ засчитали за победы у АЗ. Что непонятного?

Правка: 28 дек. 2017 21:07

itmanager85Постоялецwww28 дек. 201721:09#9
Fantarg
> Тот, кто писал текст в документе (1712.01815), либо сознательно обманул, либо
> несознательно, когда трактовал результат по 100 партиям. Эти сто партий, всего
> лишь игры из 1300 проведенных, которые указаны в строке "none" (см. таблицы).

может 1300 партий сыграли в процессе дообучения Alpha Zero ? и по последним 100 выдали сравнение ..

FantargПостоялецwww28 дек. 201721:46#10
itmanager85
> и по последним 100 выдали сравнение ..
Даже если бы было так, я пишу о том, что обманули. Не правильно трактовали итог этих 100 партий.
И это не был процесс обучения, ибо в таблицах четко указано, что играли еще и тематические партии (термин тематический означает разыгрывание определенного дебюта, где первые ходы уже сделаны заранее, так называемая начало игры с дебютной "табии"). Не тематические, это когда АЗ и СФ с первого хода стали делать ходы. Ну и в материалах по эксперименту четко было сказано, что обучение было с большого "просмотра" количество записанных известных партий, а тренировка у АЗ заключалась в игре сам с собой.
thevladПостоялецwww28 дек. 201721:48#11
Fantarg
в любом случаи оно выиграло, без десятилетий написания эвристик и экспертизы в шахматах, лол )
FantargПостоялецwww28 дек. 201721:57#12
thevlad
> лол )
Извини, а ты видел, что за агрегат этот АЗ?
Оно конечно лучше показало результат, но по то причине, что АЗ дали фору:)
Тут ведь, главное в чем? Не было никакого соревнования в шахматы, где реально сравнивали силу шахматную.

Если бы они хотели вывести хоть какую-то серьезность с этих тестов, то хотя бы дали оппонентам время на обдумывания по стандартам шахматным. В данном случае - 40 минут на 40 ходов. Результат был бы не в пользу АЗ:)
Даже дебютную книгу не нужно давать СФ (пусть всё остальное будет как есть, плохим для СФ), дайте только время на обдумывание правильно, по шахматным стандартам. Другая картинка будет!

kiparУчастникwww28 дек. 201722:54#13
Fantarg
> Тут ведь, главное в чем?
главное в том что AЗ, не имея о шахматах никакой информации кроме правил ходов, научился играть не хуже программы которую пилили люди с учетом всех знаний человечества о шахматах и всего противостояния шахматных движков.

А кто там по баллам круче - ну может СФ при каких-то комбинациях параметров и окажется впереди, но результат все равно впечатляющий.
Так то гуглу шахматы как уже "решенная" игра неинтересны, им важнее обыграть человека там где он пока впереди.

FantargПостоялецwww28 дек. 201723:20#14
kipar
> не имея о шахматах никакой информации кроме правил ходов, научился играть не хуже программы
Тут другое заблуждение (ну не совсем заблуждение). Если оценивать возможности агрегата, то это очень круто. Я же не отрицаю про мощь и крутые процессоры от Гугла, с их нейросетью. Как и дороговизму этого монстра.

Если сравнивать, что такое 9 часов обучение АЗ, то это в рамки человеческих возможностей не входит, чтобы как-то сравнивать по-нормальному. Ибо АЗ успел просмотреть и поработать со свыше 1млн партиями. Что это означает?
Это вклад нескольких поколений, как если бы шахматисты анализировали эти партии, для понимания игры и усовершенствования своей шахматной игры. Анализ (просмотр) сыгранных партий чьих-то, является неотъемлемой частью в обучение игре шахматной. Эти 9 часов АЗ просматривал и записывал себе в навык такую информацию, которая никому не подвластна за всю свою жизнь.
И со слов разработчиков СФ, было указано выше, что эти первичные 9 часов обучение на этих 5000 TPU - это 4 года СФ тестов!!! АЗ крут, только зачем его тестировали таким образом, а не в нормальной игре. Вот игру ГО (как я понял) там все хорошо, по нормальному тесты (хотя ни одной партии из этой стадии эксперимента не продемонстрировали - верьте на слово).

kipar
> Так то гуглу шахматы как уже "решенная" игра неинтересны
Вот это тоже смущает, хоть и согласен с такой позицией. Не пиарили эксперимент нигде, выдали частичку (трудно достать все важные материалы, которые указаны в отчетах по этому эксперименту), проект закрыли, но аренду своих изобретений за $млн предоставляют.

Страницы: 1 2 3 Следующая »

/ Форум / Флейм / Общее

2001—2018 © GameDev.ru — Разработка игр