Господа, такой ещё вопрос: донор (диктор) глотает окончания. К примеру:

вместо историй, слышится истори; вместо ключЕвской слышится ключЕвск; вместо барильефы слышится барильеф. Собственно вопрос про текст в LJspeech: стоит ли текст сокращать до восприятия, либо же все-таки писать слова полностью?

7 ответов

20 просмотров

Мое имхо, что точно стоит попробовать убрать буквы, которые диктор не проговаривает, если у вас получится это сделать. В таком случае сетка научится произносить ровно то что есть. И есть надежда, что при использовании с прописанными окончаниями и т. п. выговаривать будет (другое дело на сколько всё слово целиком будет консистентно звучать в таком случае, если на трейне она целых слов слышала сильно меньше). В противном же случае, сетка разучит проглатывать звуки 100% и будет говорить максимально приближено к спикеру и, более того, скорее всего глотать звуки в неожиданных для вас местах.

Текст оставить как он правильно пишется и попробовать учить такого спикера в составе мультиспикер модели.

Лучше не до обучать, а со спикер эмбедингами многоголосую модель учить.

Slava Teslenko
Лучше не до обучать, а со спикер эмбедингами много...

Тогда спикеры у которых мало данных или они шумные существенно подтянуться по качеству.

Roma-Romashkin Автор вопроса
Slava Teslenko
Лучше не до обучать, а со спикер эмбедингами много...

То, что у них разные тексты будут, не окажет негатива?

Похожие вопросы

Обсуждают сегодня

Привет, такой вопросик появился кажется ли вам что Rust слишком сложный/строгий для высокоуровневого программирования и слишком "безопасный"/строгий для низкоуровневого?
Крокант
10
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Всем привет. Хотел бы написать для себя свою ос. Причины: 1) нужен опыт в чем-то 2) будет меньше весить 3) свое, но там будут свои задумки Я понимаю что нужно писать для всег...
Shadow Akira
18
Всем привет! Скажите, никто не пытался уменьшить размер процесса ssl, которые ассоциируется с открытым соединением (не помню точное название этого процесса, но там была какая-...
Алексей
20
5? да там все 10
Boris Vinogradov
12
что такое erg?
Maksim Lapshin
2
Через бот апи возможно получить ID стикерпака? Не ссылку.
Vexylon [АФК до 09.09]
5
Why would I rent an account if it’s not mine?
Snr Engineer
3
У меня вопрос: для разработки современных (не учебных) ОС, лучше использовать уже имеющиеся архитектурные решения или нужно будет разрабатывать что-то принципиально новое?
Alexander
5
Всем привет. Запускаю snmp_server вызовом snmp:start() и получаю вот это: {bad_return, {{snmp_app,start,[normal,[]]}, {'EXIT', {{badmatch, {error, {{shutdown, {failed_to_sta...
Δημήτηρ
9
Карта сайта