170 похожих чатов

Коллеги, всем привет ) кто-нибудь дообучивал сети для машинного перевода собственными

данными?
например
rut5-base-multitask
Helsinki-NLP/opus-mt-mul-en
facebook/nllb-200-distilled-600M

какие могут быть нюансы?
какие есть результаты?

11 ответов

29 просмотров

Дообучал m2m100 и NLLB, работало нормально на тех направлениях перевода на которых дообучал, остальные подзабывались.

David Dalé
Дообучал m2m100 и NLLB, работало нормально на тех ...

Давид, а какую метрику вы использовали, чтобы сравнить перевод из коробки и после файн-тюнинга? Как вы определили, что "работало нормально"?)

Тоже в ближайшее время планирую решать эту задачу со своим датасетом. Посоветуйте, пжлст, что полезного почитать? Опыта пока нет. Я так понимаю, нужно изучить туториалы по файн-тюнингу произвольной sec2sec модели

Kate Sinkova
Давид, а какую метрику вы использовали, чтобы срав...

ChrF++ (аналог BLEU, но чуть менее чувствительный к написанию слов и иначе отмасштабированный), плюс просто глазками смотрел небольшую выборку переводов на предмет разных косяков.

David Dalé
ChrF++ (аналог BLEU, но чуть менее чувствительный ...

chrf++ кажется весьма устаревшей штукой, а COMET-20 (21/22) не пробовал?

Kate Sinkova
Тоже в ближайшее время планирую решать эту задачу ...

да, а там годится обычный seq2seq training pipeline на базе библиотеки трансформеров можно туториалы или примеры в гитхабчике также найти, посмотреть, как например - https://github.com/masakhane-io/lafand-mt/blob/main/lafand.ipynb

Daniil
chrf++ кажется весьма устаревшей штукой, а COMET-2...

имхо эти метрики про разное, и поэтому не исключают друг друга. chrf++ про лексическое сходство (также как и блю), а comet про семантику (а следовательно требует модели для нужного языка, или корпус для обучения этой модели)

᠌Vladimir Gurevich
да, а там годится обычный seq2seq training pipelin...

Благодарю! По метрике. У меня тексты грамматически и орфографически правильные и важна точность перевода терминов, поэтому кажется, что семантические метрики это не мой случай

᠌Vladimir Gurevich
да, а там годится обычный seq2seq training pipelin...

и еще вопрос: стоит ли для дообучения рассматривать фреймворк https://opennmt.net/ ?

Kate Sinkova
и еще вопрос: стоит ли для дообучения рассматриват...

вполне, но я бы в сторону fairseq смотрел, он банально более популярен и лучше поддерживается

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
как быть с принтером? такой подход прокатит?
zamtmn
12
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Карта сайта