<pad> токен в начало тренировочных предложений или нет? Может в целевое? В конфиге decoder_start_token_id начинается с <pad>
1.
- Я кенгуру
- I am a kangaroo
2.
- Я кенгуру
- <pad> I am a kangaroo
3.
- <pad> Я кенгуру
- I am a kangaroo
4.
- <pad> Я кенгуру
- <pad> I am a kangaroo
Какой из этих случаев выбрать?
- Я кенгуру - <pad> I am a kangaroo
Обсуждают сегодня