Смотри альфаго когда делали)) у них первый этап был такой же)) они учили по сыгранным партиям прогнозировать след ход.
Тогда вот и ответ) читайте про альфаго и делайте)
Там сложно все(((там использовали сверточные нейросети
Я не сильно интересовалась ни го, не альфаго, но, насколько слышала, то там все-таки rl. А ещё в этом rl, если не ошибаюсь, метод Монте-Карло. Может это поможет. Или придут умные люди и поймут, что такое шаблон в вашем случае)) и помогут хорошими советами
Правильно rl и монтекарло. У них было 4этапа. 4этап был как раз и монтекарло который использовал 3предыдущих этапа)) 1. обозначить вероятность каждого варианта. Самый сильныц и есть след ход 2 используя результат первого играла сама с собоц множество ДО КОНЦА делая разметку f(позиция) = оценка(0 до 1) 3 решение разметки это уже ml) 4 и все 3компонента это параметры монтекарло. Играла сама с собой уже с "пониманием позиции"
Вы же понимаете, что вы так к "шаблонам" не придете? Это так, btw
Я не знаю, тут уже упоминали или нет, но Есть KataGo, публичная реализация AlphaZero (апгрейд AlphaGo), которая может много вещей делать умных. Например, предсказывать хороший ход без Монте-Карло (такая сетка сама по себе имеет где-то 5й дан), предсказывать вероятность победить, и может оценивать территорию. Есть огромное количество предобученных чекпоинтов (готовые обученные нейросети) с разными ЭЛО рейтингами, от рандома до superhuman level. Если вам надо ваши ситуации классифицировать - можно взять предобученную сетку, натянуть поверх нее линейный классификатор и обучить на 500 примеров, а остальные предсказать обученной моделью.
Обсуждают сегодня