Привет, существуют ли инструменты для преобразования текста в слова? Например

слово d1masik преобразовывает в димасик, 12 в двенадцать, или günter в гюнтер

19 ответов

13 просмотров

https://github.com/snakers4/russian_stt_text_normalization но с димасиком не справится

мож такое? Кирилизатор function translit(word) { const converter = { 'sch': 'щ', 'yo': 'ё', 'zh': 'ж', 'ch': 'ч', 'sh': 'ш', 'yu': 'ю', 'ya': 'я', 'a': 'а', 'b': 'б', 'v': 'в', 'g': 'г', 'd': 'д', 'e': 'е', 'z': 'з', 'и': 'i', 'y': 'й', 'k': 'к', 'l': 'л', 'm': 'м', 'n': 'н', 'o': 'о', 'p': 'п', 'r': 'р', 's': 'с', 't': 'т', 'u': 'у', 'f': 'ф', 'h': 'х', 'c': 'ц', 'y': 'ы', }; Object.keys(converter).forEach(function(key){ var value = converter[key]; if(value != '') word = word.replace(new RegExp(key, 'g'), value); }) return word; } log(translit('schuka'));

Ivan- Автор вопроса
Ivan
С d1masik не справится

а не подскажешь, в чем суть заключается, зачем?

Ivan- Автор вопроса
Ivan
С d1masik не справится

есть у меня идея, щя скину

Ivan- Автор вопроса
Сергей Валентинович
Дабавь 1 и "и"

Мне кажется, слишком много таких в разных комбинациях

Ivan
Чтобы tts нормально читал

Про нормализацию текста от сайта антиплагиат https://habr.com/ru/company/antiplagiat/blog/529574/ Нормализация нейросетью (либой) от гугла https://habr.com/ru/post/45489/ Нормализация юникода, как метод борьбы с хитрым (юникод) спамом https://habr.com/ru/post/45489/

Ivan- Автор вопроса
Ivan- Автор вопроса
Ivan
Спасибо, вроде то что надо

Хотя они цифры тожн не учитывают

Ivan
Хотя они цифры тожн не учитывают

Тогда свой словарь собирай...

Ivan- Автор вопроса

Кто-то может в своем нике в случайном месте заменить букву или пару букв цифрой и никакой словарь не поможет

по идее должен. тк для спуфинга 0 периодически юзают вместо о

Ivan- Автор вопроса
Q
по идее должен. тк для спуфинга 0 периодически юза...

Тут два разных случая. В одном цифра выглядит как буква, в другом она звучит как буква

Ivan
Тут два разных случая. В одном цифра выглядит как ...

я тебя не понял. в случае с "димасиком" задача сводится к тому чтобы нормализовать его до русских букв

Ivan
Да

ну вот в статье антиплагиата та же задача преследуется. и юзают они под это либу гугла

Похожие вопросы

Обсуждают сегодня

Так а кто может спарсить всех участников чата? Идишники
Magic
18
Как удалить health check в Consul? Казалось бы, это должно быть не сложно, но я не могу найти в документации ничего про это, только про добавление service с health check "в н...
Roman
2
да пофиг на капчу зашел в чат и молчишь при этом ты нонейм? пошел вон
Magic
17
Гайз, а как отправлять с вейпора пуши на андроид? ) Меня вот осенило )))
Serg
11
А как можно понять что пользовательская программа завершилась если она не вызывала сисколл exit?
One
4
Всем доброго дня. Возвращаясь к вопросу о варнингах: есть ли способ заставить компилятор ругаться на вызов функций языка, которые уже не существуют? Например, я могу спокойно ...
Δημήτηρ
2
Все еще ржу с mov ax, 0xA000 ; graphic segment ?? mov gs, ax
Berkus Decker
4
Как думаете, будут макбуки на WWDC?
Dmytro
6
Привет, кто может сделать юзербота с апи? Задачи: - создавать группы - создавать каналы - задавать для созданных каналов аватарку или эмоджи, имя группы - добавлять в группы...
Lencore
13
Нужно магазин с тильды на опен кат перенести Есть кто умеет? В лс
Magic
8
Карта сайта