слово d1masik преобразовывает в димасик, 12 в двенадцать, или günter в гюнтер
https://github.com/snakers4/russian_stt_text_normalization но с димасиком не справится
мож такое? Кирилизатор function translit(word) { const converter = { 'sch': 'щ', 'yo': 'ё', 'zh': 'ж', 'ch': 'ч', 'sh': 'ш', 'yu': 'ю', 'ya': 'я', 'a': 'а', 'b': 'б', 'v': 'в', 'g': 'г', 'd': 'д', 'e': 'е', 'z': 'з', 'и': 'i', 'y': 'й', 'k': 'к', 'l': 'л', 'm': 'м', 'n': 'н', 'o': 'о', 'p': 'п', 'r': 'р', 's': 'с', 't': 'т', 'u': 'у', 'f': 'ф', 'h': 'х', 'c': 'ц', 'y': 'ы', }; Object.keys(converter).forEach(function(key){ var value = converter[key]; if(value != '') word = word.replace(new RegExp(key, 'g'), value); }) return word; } log(translit('schuka'));
С d1masik не справится
Дабавь 1 и "и"
а не подскажешь, в чем суть заключается, зачем?
Чтобы tts нормально читал
есть у меня идея, щя скину
Мне кажется, слишком много таких в разных комбинациях
Про нормализацию текста от сайта антиплагиат https://habr.com/ru/company/antiplagiat/blog/529574/ Нормализация нейросетью (либой) от гугла https://habr.com/ru/post/45489/ Нормализация юникода, как метод борьбы с хитрым (юникод) спамом https://habr.com/ru/post/45489/
Спасибо, вроде то что надо
Хотя они цифры тожн не учитывают
Тогда свой словарь собирай...
Кто-то может в своем нике в случайном месте заменить букву или пару букв цифрой и никакой словарь не поможет
по идее должен. тк для спуфинга 0 периодически юзают вместо о
Тут два разных случая. В одном цифра выглядит как буква, в другом она звучит как буква
я тебя не понял. в случае с "димасиком" задача сводится к тому чтобы нормализовать его до русских букв
Обсуждают сегодня