Может есть смысл оставить 361?)

Я не сильно интересовалась ни го, не альфаго, но, насколько слышала, то там все-таки rl. А ещё в этом rl, если не ошибаюсь, метод Монте-Карло. Может это поможет. Или придут умные люди и поймут, что такое шаблон в вашем случае)) и помогут хорошими советами

0

05.08.2021

Kostya bah

Marianna Kovalova
Я не сильно интересовалась ни го, не альфаго, но, ...

Правильно rl и монтекарло. У них было 4этапа. 4этап был как раз и монтекарло который использовал 3предыдущих этапа)) 1. обозначить вероятность каждого варианта. Самый сильныц и есть след ход 2 используя результат первого играла сама с собоц множество ДО КОНЦА делая разметку f(позиция) = оценка(0 до 1) 3 решение разметки это уже ml) 4 и все 3компонента это параметры монтекарло. Играла сама с собой уже с "пониманием позиции"

0

05.08.2021

Sergei L

Kostya bah
Правильно rl и монтекарло. У них было 4этапа. 4эт...

Вы же понимаете, что вы так к "шаблонам" не придете? Это так, btw

0

05.08.2021

Timofey Naumenko

Kostya bah
Правильно rl и монтекарло. У них было 4этапа. 4эт...

Я не знаю, тут уже упоминали или нет, но Есть KataGo, публичная реализация AlphaZero (апгрейд AlphaGo), которая может много вещей делать умных. Например, предсказывать хороший ход без Монте-Карло (такая сетка сама по себе имеет где-то 5й дан), предсказывать вероятность победить, и может оценивать территорию. Есть огромное количество предобученных чекпоинтов (готовые обученные нейросети) с разными ЭЛО рейтингами, от рандома до superhuman level. Если вам надо ваши ситуации классифицировать - можно взять предобученную сетку, натянуть поверх нее линейный классификатор и обучить на 500 примеров, а остальные предсказать обученной моделью.

0

19.08.2021

Kostya bah · Accepted Answer

Kostya bah

Смотри альфаго когда делали)) у них первый этап был такой же)) они учили по сыгранным партиям прогнозировать след ход.

0

04.08.2021

215 похожих чатов

Может есть смысл оставить 361?)

7 ответов

Похожие вопросы