Вопрос по будущему датасету для TTS: на какие моменты надо обращать

внимание?

Пока выделил себе следующие:
1. помещение и оборудование, где записываем одно и то же(чтоб фоновой шум был идентичным)
2. расстояние до микрофона одинаковое, чтоб громкость была одинакова
3. в день не записывать более 1 часа, так как голос устает
4. текст должен покрыть все звуки,биграммы, а может и триграммы
5. интонация всегда одна и та же(не понятно пока, как можно проверить автоматически)

3 ответов

17 просмотров

5. Выделять f0 и как-то сравнивать с мелодическим рисунком выбранной интонационной конструкции

Вопросительные и восклицательные интонации важно, иначе будет просто безэмоционально. Плюс желательно чтобы не начитка книг была, иначе потом будет бот говорить как будто читает.

Интонацию нужно разнообразную и, по возможности, следить, чтобы дикторы сначала все предложения осмыслили, и интонационные ударения были в нужном месте. Это может показаться глупым замечанием, но люди иногда читают предложение так, как будто не понимают, о чём там вообще, и на синтезе это может звучать не очень. Хотя бы инструктаж на эту тему провести. И попытаться избежать сильных лицевых шумов (щелки, громкие цоканья и т.д.)

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта