он иногда оставляет русские слова а иногда и предложения. Пример: boy walked through a lesson (асоциальная девиация), positive deviation heroism?
У меня после дообучения на целевой языковой паре такое само проходило. Если дообучать нет ресурса, можно все слова из исходного текста добавить в bad_words_ids, чтобы их модель не генерировала (только надо проследить, чтобы туда не попали непереводимые вещи, типа пунктуации, цифр, и названий брендов. например, можно запрещать только слова, полностью состоящие из русского алфавита).
Обсуждают сегодня