аргументы скрипта. Не?
после прописывания в коде датасета вручную посмотрел: в логе пишет правильный датасет. Но кроме датасета у модели еще есть вспомогательные файлы типа vocab.json и другие, штук 6, и логгер пишет, что они подгружаются из кеша. я уже думаю, что может датасет верный берется, но токены-слова берутся старые, со старого датасета и новых, добавленных мной там нет, и поэтому и работает по старому. Почему так кажется, тк статистики слов пишутся при запуске тренировки и они всегда одинаковые для тренировочного и валидационного разделения датасета
Обсуждают сегодня