меня интерсует какой алгоритм машинного обучения использовать для победы, хотя бы знать какие подходы существуют в играх с неполной информацией. Неужели только обучение с подкреплением эффективно?
для победы в чем? У людей при игре в покерруме - критерий это общий винрейт, выраженный в увеличении банкролла. Если берем бота - у него критерий это частный винрейт в игре 1 на 1. Соответственно подходы разные
Обсуждают сегодня