лучше использовать в качестве входных признаков? И чем заполнить тензор в случае досрочной победы/поражения, то есть когда останутся свободные клетки но игра уже будет закончена?
Если хотите результат получить - посмотрите minimax, а если что PoC - посмотрите reinforcement learning
правильно понимаю что минимакс является частью reinforcement learning? что за абревиатура PoC ?
Proof of concept Ну тоесть, то, что ты решаешь задачу не для того чтобы получить какой-то стоящий результат, а чисто для души или чтобы попробовать не самый эффективный способ
Не слушай Dominux, poc это совсем другое, Википедия вполне хорошо объяснит
Что из того, что я сказал - неверно?
Обсуждают сегодня