Ребят, скажите, с чем может быть связано, что модель стала

знакомые ей слова и которые она ранее произносила хорошо вдруг взять и перестать из синтезировать?

8 ответов

18 просмотров

прям вообще ни с того ни с сего?

Roma-Romashkin Автор вопроса
Лис Электронщик
прям вообще ни с того ни с сего?

Пока так однозначно не могу сказать что могло предшествовать. Может нагрузка на сервак...выясняю

Roma-Romashkin Автор вопроса
Roma Romashkin
Пока так однозначно не могу сказать что могло пред...

Провел ряд экспериментов и обнаружил что знаки препинания могут существенно нарушать синтез речи (какое-то заедание, зажовывание). Даже на тех данных, которая модель видела неоднократно. не знаю "Манделло ли всему виной", но факт есть факт (проверил на разных серверах и на моделях с разным количеством эпох)

Roma-Romashkin Автор вопроса
Roma Romashkin
Провел ряд экспериментов и обнаружил что знаки пре...

какие могут быть предположения по этими обстоятельствам? VITS2, общее количество эпох 5 тысяч. Последняя модель хуже всех синтезирует речь. Но опять таки же смотря на каком тексте. Ниже приведу два файла одной и той же модели. Притом в коротком файле эти данные модель видела много раз

Roma Romashkin
какие могут быть предположения по этими обстоятель...

Вы сохраняли промежуточные чекпоинты в процессе обучения модели? Попробуйте с каким-нибудь из них. Вы не меняли фонемайзер? Может быть при обучении и при инференсе у вас какие-то не одинаковые фонемайзеры?

Roma-Romashkin Автор вопроса
Alexey Bazarov
Вы сохраняли промежуточные чекпоинты в процессе об...

Да, сохранял промежуточные. Пробовал на них- результат +- такой же. Фонемайзер один. Предполагаю что возможно в датасете на вот этой фразе «Уважаемые дамы и господа, дорогие друзья, тема моего обращения.» ошибка какая-то (возможно перепутаны аудиофайлы между собой и с текстом). Завтра буду разбираться с датасетом- все равно хотел улучшить его и фонемы ручками доработать

Roma Romashkin
Да, сохранял промежуточные. Пробовал на них- резул...

У меня три предположения (все довольно тупые, но вдруг): 1. символы или их порядок у моделей отличаются. грубо говоря, где-то зашито, что модель понимает «абвгд…», а теперь грузится чекпоинт, где символы при обучении были в другом порядке, типа «.,?!абвгд…» и модель глючит, потому что при конвертации текста в айдишники получается ерунда 2. выше написано, что модель в продакшн-окружении, если ей синтезируют, не могло ли такое быть, что ей забыли сделать eval() или torch.no_grad и это повлияло? 3. или препроцессинг текста раньше был другой, возможно?

Roma-Romashkin Автор вопроса
Korovsky
У меня три предположения (все довольно тупые, но в...

В итоге выяснил что Продакшн не оказывает влияния. Препроцессинг один и тот же. Удалось выяснить какая фраза вызывает ошибку. Сегодня-завтра пройдусь ещё раз по датасету. Что-то мне кажется где-то произошла ошибка в LJSpeech. Отпишу по результату. Большое спасибо всем участникам за диалог! 🫂

Похожие вопросы

Обсуждают сегодня

Привет, такой вопросик появился кажется ли вам что Rust слишком сложный/строгий для высокоуровневого программирования и слишком "безопасный"/строгий для низкоуровневого?
Крокант
10
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Всем привет. Хотел бы написать для себя свою ос. Причины: 1) нужен опыт в чем-то 2) будет меньше весить 3) свое, но там будут свои задумки Я понимаю что нужно писать для всег...
Shadow Akira
18
Всем привет! Скажите, никто не пытался уменьшить размер процесса ssl, которые ассоциируется с открытым соединением (не помню точное название этого процесса, но там была какая-...
Алексей
20
5? да там все 10
Boris Vinogradov
12
что такое erg?
Maksim Lapshin
2
Через бот апи возможно получить ID стикерпака? Не ссылку.
Vexylon [АФК до 09.09]
5
Why would I rent an account if it’s not mine?
Snr Engineer
3
У меня вопрос: для разработки современных (не учебных) ОС, лучше использовать уже имеющиеся архитектурные решения или нужно будет разрабатывать что-то принципиально новое?
Alexander
5
Всем привет. Запускаю snmp_server вызовом snmp:start() и получаю вот это: {bad_return, {{snmp_app,start,[normal,[]]}, {'EXIT', {{badmatch, {error, {{shutdown, {failed_to_sta...
Δημήτηρ
9
Карта сайта