что не используется мой датасет, хотя указываю его в терминале стандартно как параметр.
И после обучения модель работает, ставлю при interact.py model_checkpont ./путь до своего чекпоинта с моделью и вспомогательными файлами НО опять же, модель старая.
Стал думать что это что-то с кешем: в репозитории который юзаю, там качается датасет автоматом если юзер не указывает его как параметр в терминале. Я думаю, что датасет из кеша как-то подменяет мой датасет.
В общем даже точно не знаю, это специфичная проблема этого репозитория или это общая проблема с обучением сеток, но я ее впервые увидел
запуск тренировки
python ./train.py —gradient_accumulation_steps=4 —lm_coef=2.0 —max_history=2 —n_epochs=1 —num_candidates=4 —personality_permutations=2 —train_batch_size=1 —valid_batch_size=1 —dataset_path ./my.json
запуск на использование
python ./interact.py --model_checkpoint ./runs/Oct05_01-32-39_mypc-tf_ai/
кто сталкивался?
Воспользуйтесь дебаггером
Обсуждают сегодня