Кто-Нибудь может пожалуйста подсказать, как выставить длину генерации при обучении

Question

Кто-Нибудь может пожалуйста подсказать, как выставить длину генерации при обучении

в T5? Я использую Seq2SeqTrainer с DataCollatorForSeq2Seq (max_length в нем пробовал, не помогает)

На скриншоте print из compute_metrics, target - текст из датасета нормальной длины, а нейронка выдает слишком короткий prediction (ну и потом, при использовании уже обученной модели видно, что она не умеет заканчивать предложения)

#nlp #programming #russian

0

18.08.2021

3 ответов

39 просмотров

Bogdan Автор вопроса

Так он там и есть, это </s>

0

18.08.2021

PuffOfSmoke

И в generate есть максимум длины, минимум и пенальти за длину При обучении всё это не нужно

0

18.08.2021

PuffOfSmoke · Accepted Answer

PuffOfSmoke

В лэйблах маст хэв EOS токен

0

18.08.2021

170 похожих чатов

Кто-Нибудь может пожалуйста подсказать, как выставить длину генерации при обучении

3 ответов

Похожие вопросы