начальное (но не полное) понимание модели?
Например, если я хочу обучить агента играть в игру Х, но хочу чтобы он знал изначально какие ходы будут не-валидные и как его ходы будут частично влиять на состояние (при этом я не могу сказать как будет действовать соперник, который тоже часть окружения)
https://arxiv.org/abs/1703.05407 Ну есть вот такая штука, где агенту сначала дают “освоиться” в среде, и только потом начинают ставить какие-то задачи извне
Обсуждают сегодня