(цель - просто потренироваться писать кастомные(!) нейронки).
На вход хочу подавать вектор в котором закодировано положение дел в виде нулей и единиц:
первые девять бит - это крестики,
вторые девять элементов - это нолики,
третие девять элементов - это свободные ячейки.
Хочу, чтоб на выходе нейронка показывала куда нужно ходить (наилучший ход), чтоб выйграть (или НЕ проиграть).
Как обучить классификатор - инфы много (хоть ж.. жуй)
А вот как обучать нейронку "многоходовочкам" - инфы мало (или она на английском, и воспринимается медленнее и в неполной мере)
Собственно вопросы:
1)Нужна ли здесь рекуррентная/рекурсивная нейронка.
2)если я выберу рекуррентную/рекурсивную нейронку, то как сделать её переменной глубины?
3)посоветуйте статью (или другой материал), в котором ПОНЯТНО, на ПРИМЕРАХ описывается КАК обучать нейронки "многоходовкам"?
Могу только подкинуть к тому что Aragaer пишет, что в целом можешь сетку учить против рандомного алгоритма, а потом сетка против сетки. В многоходовках по крайней мере в этой задаче смысла не вижу. Тут еще имхо проблема что оценки у тебя скорее всего строго бинарные. Соответственно видимо надо оценивать по результатам нескольких матчей (штук 30, например - число взято нашару)
Обсуждают сегодня