Привет, существуют ли инструменты для преобразования текста в слова? Например

слово d1masik преобразовывает в димасик, 12 в двенадцать, или günter в гюнтер

19 ответов

53 просмотра

https://github.com/snakers4/russian_stt_text_normalization но с димасиком не справится

мож такое? Кирилизатор function translit(word) { const converter = { 'sch': 'щ', 'yo': 'ё', 'zh': 'ж', 'ch': 'ч', 'sh': 'ш', 'yu': 'ю', 'ya': 'я', 'a': 'а', 'b': 'б', 'v': 'в', 'g': 'г', 'd': 'д', 'e': 'е', 'z': 'з', 'и': 'i', 'y': 'й', 'k': 'к', 'l': 'л', 'm': 'м', 'n': 'н', 'o': 'о', 'p': 'п', 'r': 'р', 's': 'с', 't': 'т', 'u': 'у', 'f': 'ф', 'h': 'х', 'c': 'ц', 'y': 'ы', }; Object.keys(converter).forEach(function(key){ var value = converter[key]; if(value != '') word = word.replace(new RegExp(key, 'g'), value); }) return word; } log(translit('schuka'));

Ivan- Автор вопроса
Ivan
С d1masik не справится

а не подскажешь, в чем суть заключается, зачем?

Ivan- Автор вопроса
Ivan
С d1masik не справится

есть у меня идея, щя скину

Ivan- Автор вопроса
Сергей Валентинович
Дабавь 1 и "и"

Мне кажется, слишком много таких в разных комбинациях

Ivan
Чтобы tts нормально читал

Про нормализацию текста от сайта антиплагиат https://habr.com/ru/company/antiplagiat/blog/529574/ Нормализация нейросетью (либой) от гугла https://habr.com/ru/post/45489/ Нормализация юникода, как метод борьбы с хитрым (юникод) спамом https://habr.com/ru/post/45489/

Ivan- Автор вопроса
Ivan- Автор вопроса
Ivan
Спасибо, вроде то что надо

Хотя они цифры тожн не учитывают

Ivan- Автор вопроса

Кто-то может в своем нике в случайном месте заменить букву или пару букв цифрой и никакой словарь не поможет

по идее должен. тк для спуфинга 0 периодически юзают вместо о

Ivan- Автор вопроса
Q
по идее должен. тк для спуфинга 0 периодически юза...

Тут два разных случая. В одном цифра выглядит как буква, в другом она звучит как буква

Ivan
Тут два разных случая. В одном цифра выглядит как ...

я тебя не понял. в случае с "димасиком" задача сводится к тому чтобы нормализовать его до русских букв

Ivan
Да

ну вот в статье антиплагиата та же задача преследуется. и юзают они под это либу гугла

Похожие вопросы

Обсуждают сегодня

Привет, такой вопросик появился кажется ли вам что Rust слишком сложный/строгий для высокоуровневого программирования и слишком "безопасный"/строгий для низкоуровневого?
Крокант
10
Всем привет. Хотел бы написать для себя свою ос. Причины: 1) нужен опыт в чем-то 2) будет меньше весить 3) свое, но там будут свои задумки Я понимаю что нужно писать для всег...
Shadow Akira
18
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Всем привет! Скажите, никто не пытался уменьшить размер процесса ssl, которые ассоциируется с открытым соединением (не помню точное название этого процесса, но там была какая-...
Алексей
20
5? да там все 10
Boris Vinogradov
12
Через бот апи возможно получить ID стикерпака? Не ссылку.
Vexylon [АФК до 09.09]
5
Why would I rent an account if it’s not mine?
Snr Engineer
3
У меня вопрос: для разработки современных (не учебных) ОС, лучше использовать уже имеющиеся архитектурные решения или нужно будет разрабатывать что-то принципиально новое?
Alexander
5
Всем привет. Запускаю snmp_server вызовом snmp:start() и получаю вот это: {bad_return, {{snmp_app,start,[normal,[]]}, {'EXIT', {{badmatch, {error, {{shutdown, {failed_to_sta...
Δημήτηρ
9
@berkus @diaevd как бы вы сделали dependency injection но без шаблонов?
Boris Vinogradov
5
Карта сайта