170 похожих чатов

Господа - а есть локальная модель, которая хорошо переводить умеет

англ-другие языки? Потому как судя по всему LLAMA 2 годная история, но только на английском

8 ответов

5 просмотров

NLLB - SOTA по переводу

Юрий-Новоселов Автор вопроса
datascience xc
NLLB - SOTA по переводу

какой нибудь линк не подскажете где искать?

datascience xc
NLLB - SOTA по переводу

Кстати вопрос по NLLB. Его надо кормить целыми абзацами, или отдельными предложениями? (а то он как-то вольно относится к абзацам,может выкинуть отдельные предложения. и с предложениями тоже бывают косяки — бывает выдаёт зацикленное)

Al Zatv
Кстати вопрос по NLLB. Его надо кормить целыми абз...

Если используете из коробки, то отдельными предложениями, ибо обучалась эта модель исключительно на единичных предложениях. Наверное, можно ее так пофайнтюнить, чтобы и на небольших абзацах работала, но я не пробовал.

David Dalé
Если используете из коробки, то отдельными предлож...

Пасиб. Интуитивно кажется,что лучше бы абзацами — ну чтоб ей было за мыслью проще следить. Но раз так не учили, то понятно.

David Dalé
Если используете из коробки, то отдельными предлож...

Кстати,а чем бы побить на предложения, плюс-минус языконезависимо? Пробовал ersatz, он в англ неплох, но в русском слабоват.

Al Zatv
Кстати,а чем бы побить на предложения, плюс-минус ...

Авторы самой NLLB использовали вот такой языкозависимый скрипт с выбором своего специфичного сплиттера для кучи языков. https://github.com/facebookresearch/stopes/blob/main/stopes/pipelines/monolingual/utils/sentence_split.py

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
@FAssembler ты много с формами работал, как цикл обработки сообщений от окошек надо делать, чтобы IsDialogMessage не ломал ввод в эдиты и навигация по табам работала?
The Bird of Hermes
8
Карта сайта