В русском языке есть такая интересная штука как омографы. Друзья,

как вы думаете, надо ли перед началом обучения TTS модели проставить в текстах ударения во всех омографах, или по мере обучения нейронная сеть сама разберется, куда падает ударение в зависимости от сочетания слов? Ради интереса прикрепляю к моему сообщению текстовый файл со списком омографов из романа "Преступление и наказание".

7 ответов

21 просмотр

Я думал на детских книгах собрать датасет с омографами. Но на сколько я понимаю, ударения на ё и в омографах тюнят потом

Q
Я думал на детских книгах собрать датасет с омогра...

Но наверняка я ошибаюсь и кто-то опытный подскажет варианты лучше

тоже сейчас трейню витц но на символьном уровне а не на фонемах,раставил в датасете ударения используя https://huggingface.co/inkoziev/accentuator вроде стало лучше

Alexey-Bazarov Автор вопроса
Terа́Spа́ce Stories: 10^12 Space |🥴🤗|
тоже сейчас трейню витц но на символьном уровне а ...

Ударения я расставляю по словарю во всех словах. Мой вопрос связан именно с омографами: сможет ли НС разобраться, что висеть может "зам+ок", а на горе может стоять "з+амок"? Или такие вещи может понять только живой человек? Можно ещё подавать при обучении равноударное слово...

Alexey Bazarov
Ударения я расставляю по словарю во всех словах. М...

я конечно не проверял но сетки такого типа не реагируют на контекст скорее всего

Не замечали, много там ошибок? По сравнению со StressRNN, например.

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта