Привет. Есть такой вопрос.. Обучаю Fred-T5. Очень странные графики. Это

Question

Привет. Есть такой вопрос.. Обучаю Fred-T5. Очень странные графики. Это

несколько запусков модели на датасете около 100К примеров по 4 эпохи. на границе эпохи идет резкий скачок loss вниз.

Значит ли это что данные слишком разнотипные и модель просто переобучается практически сразу. Или может быть данных мало?

#nlp #programming #russian

0

06.10.2023

3 ответов

20 просмотров

David Dalé

В этом нет абсолютно никакой аномалии. Чем чаще модель "видела" текст (точнее, делала на н

0

06.10.2023

David Dalé

В этом нет абсолютно никакой аномалии. Чем чаще модель "видела" текст (точнее, делала на нём шаг обучения), тем меньше у не

0

06.10.2023

Temirlan · Accepted Answer

Temirlan

Запоминает

0

06.10.2023

170 похожих чатов

Привет. Есть такой вопрос.. Обучаю Fred-T5. Очень странные графики. Это

3 ответов

Похожие вопросы