задаче очень важен перевод терминов, причем у меня есть список пар из этих терминов с переводом.
Какая-нибудь BLEU будет считать все слова с одинаковым весом, а мне бы хотелось, чтобы мои термины были самыми важными и за их неправильный перевод штрафовать модель сильнее, чем за неточности в общей лексике.
Как мне сделать такую прокси-метрику?
Поддерживаю, тоже очень интересно, имею идею по похожей задаче. Распознавать "слэнг".
Обсуждают сегодня