обучать заново? У меня есть несколько Т5 энкодеров, которые я тюню на определённом наборе данных. Предположим, через месяц данных стало чуть больше И некоторые таргеты предыдущих данных были изменены задним числом чтобы соответствовать актуальной реальности. Есть гипотеза что можно стартануть процесс обучения более оптимально, использовав предыдущую модель, но нет возможности и ресурсов её проверять. Не будет ли например переобучения по семплам, которые не изменились. Все ли данные брать. И много других. Где-то можно про такое почитать?
Этл реальная проблема, life learning, нужно либо модель сразу такую делать изначально, либо вот такие проблемы с файнтюнингом каждый раз заново.
Обсуждают сегодня