В русском языке есть такая интересная штука как омографы. Друзья,

Question

В русском языке есть такая интересная штука как омографы. Друзья,

как вы думаете, надо ли перед началом обучения TTS модели проставить в текстах ударения во всех омографах, или по мере обучения нейронная сеть сама разберется, куда падает ударение в зависимости от сочетания слов? Ради интереса прикрепляю к моему сообщению текстовый файл со списком омографов из романа "Преступление и наказание".

#it #russian #speech-recognition

0

17.07.2023

7 ответов

46 просмотров

Q

Q
Я думал на детских книгах собрать датасет с омогра...

Но наверняка я ошибаюсь и кто-то опытный подскажет варианты лучше

0

17.07.2023

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|

тоже сейчас трейню витц но на символьном уровне а не на фонемах,раставил в датасете ударения используя https://huggingface.co/inkoziev/accentuator вроде стало лучше

0

17.07.2023

Alexey Bazarov Автор вопроса

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|
тоже сейчас трейню витц но на символьном уровне а ...

Ударения я расставляю по словарю во всех словах. Мой вопрос связан именно с омографами: сможет ли НС разобраться, что висеть может "зам+ок", а на горе может стоять "з+амок"? Или такие вещи может понять только живой человек? Можно ещё подавать при обучении равноударное слово...

0

17.07.2023

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|

Alexey Bazarov
Ударения я расставляю по словарю во всех словах. М...

я конечно не проверял но сетки такого типа не реагируют на контекст скорее всего

0

17.07.2023

Toma Solo

Не замечали, много там ошибок? По сравнению со StressRNN, например.

0

20.07.2023

Nikolay V. Shmyrev