170 похожих чатов

Всем привет нужен совет МЛовца, хочу написать нейронку для "крестиков-ноликов"

(цель - просто потренироваться писать кастомные(!) нейронки).
На вход хочу подавать вектор в котором закодировано положение дел в виде нулей и единиц:
первые девять бит - это крестики,
вторые девять элементов - это нолики,
третие девять элементов - это свободные ячейки.

Хочу, чтоб на выходе нейронка показывала куда нужно ходить (наилучший ход), чтоб выйграть (или НЕ проиграть).

Как обучить классификатор - инфы много (хоть ж.. жуй)
А вот как обучать нейронку "многоходовочкам" - инфы мало (или она на английском, и воспринимается медленнее и в неполной мере)
Собственно вопросы:
1)Нужна ли здесь рекуррентная/рекурсивная нейронка.
2)если я выберу рекуррентную/рекурсивную нейронку, то как сделать её переменной глубины?
3)посоветуйте статью (или другой материал), в котором ПОНЯТНО, на ПРИМЕРАХ описывается КАК обучать нейронки "многоходовкам"?

1 ответов

13 просмотров

Могу только подкинуть к тому что Aragaer пишет, что в целом можешь сетку учить против рандомного алгоритма, а потом сетка против сетки. В многоходовках по крайней мере в этой задаче смысла не вижу. Тут еще имхо проблема что оценки у тебя скорее всего строго бинарные. Соответственно видимо надо оценивать по результатам нескольких матчей (штук 30, например - число взято нашару)

Похожие вопросы

Обсуждают сегодня

Ребят в СИ можно реализовать ООП?
Николай
32
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем доброго вечера. Разрабатываю 32 раз. приложение в Delphi. Столкнулся с тем, что стандартный  TFilestream  не работает с большим файлом > 2 ГБайт (после вызова функции see...
Vadim Gl
16
У меня задача: написать брокер сообщений. Очереди и потребители. Очереди поддерживают приоритеты. Очередь отдает сообщения, только обработчикам с соответствующими характеристи...
Aleksandr Filippov
2
добрый день. Подскажите, есть сайт на 1.4.7 и я хочу обновиться, особо ничего не меняя. мне выбирать версию 1.4.35 или третью ветку? и можно ли обновлять "как есть", или нужно...
Digital Cat
12
народ, плиз хелп, всю голову сломал себе уже... разве может быть так, что GetProcAddress( GetModuleHandle( "kernel32.dll" ), "SetThreadDescription" ) вернёт ненулевое значение...
Iluha Companets
12
Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Всем доброго вечера. Разрабатываю 32 раз. приложение в Delphi. Столкнулся с тем, что стандартный TFilestream не работает с большим файлом > 2 ГБайт (после вызова функции see...
Vadim Gl
8
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Карта сайта