имею в виду, у меня есть большой датасет пар, я натренировала модель, потом добавилось небольшое количество новых данных, хочется дотренировать модель на новых данных, но чтобы и старые она не забыла.
Обычно выбирают из трёх вещей: 1) дообучают на новых парах небольшое число шагов, надеясь, что забывания не произойдёт 2) дообучают на новых парах, но на каждом шаге веса модели чуть-чуть тянут в направлении старых весов (тех, которые были до дообучения) 3) дообучают на смеси новых и старых пар
Обсуждают сегодня