идет нормально), но на этапе валидации время подсчета метрик какое-то бесконечное, оно явно никак не соотносится с количеством сэмплов в валидационном датасете
сейчас на 8000 примерно примеров (средняя длина и ответа, и генерации меньше 10 токенов) считается уже хз сколько, ну минут 40 наверное
это из-за того, что генерация - долго, я правильно понимаю? или что-то идет не так?
Если актуально, на валидации я так понимаю ты передаешь compute_metrics Чтобы это осуществить трейнер по дефолту должен предиктить и сохранять логиты в оперативу, а они не маленькие Почитай про eval_accumulation_steps и preprocess_logits_for_metrics
Обсуждают сегодня