агента в частично наблюдаемой среде. Помимо обучения с подкреплением какие ещё существуют методы обучения для частично наблюдаемых сред?
Нашёл только "Эволюционные стратегии как масштабируемая альтернатива обучению с подкреплением"
чем не устраивает обучение с подкреплением?
Обсуждают сегодня