Ребят, скажите, с чем может быть связано, что модель стала

знакомые ей слова и которые она ранее произносила хорошо вдруг взять и перестать из синтезировать?

8 ответов

21 просмотр

прям вообще ни с того ни с сего?

Roma-Romashkin Автор вопроса
Лис Электронщик
прям вообще ни с того ни с сего?

Пока так однозначно не могу сказать что могло предшествовать. Может нагрузка на сервак...выясняю

Roma-Romashkin Автор вопроса
Roma Romashkin
Пока так однозначно не могу сказать что могло пред...

Провел ряд экспериментов и обнаружил что знаки препинания могут существенно нарушать синтез речи (какое-то заедание, зажовывание). Даже на тех данных, которая модель видела неоднократно. не знаю "Манделло ли всему виной", но факт есть факт (проверил на разных серверах и на моделях с разным количеством эпох)

Roma-Romashkin Автор вопроса
Roma Romashkin
Провел ряд экспериментов и обнаружил что знаки пре...

какие могут быть предположения по этими обстоятельствам? VITS2, общее количество эпох 5 тысяч. Последняя модель хуже всех синтезирует речь. Но опять таки же смотря на каком тексте. Ниже приведу два файла одной и той же модели. Притом в коротком файле эти данные модель видела много раз

Roma Romashkin
какие могут быть предположения по этими обстоятель...

Вы сохраняли промежуточные чекпоинты в процессе обучения модели? Попробуйте с каким-нибудь из них. Вы не меняли фонемайзер? Может быть при обучении и при инференсе у вас какие-то не одинаковые фонемайзеры?

Roma-Romashkin Автор вопроса
Alexey Bazarov
Вы сохраняли промежуточные чекпоинты в процессе об...

Да, сохранял промежуточные. Пробовал на них- результат +- такой же. Фонемайзер один. Предполагаю что возможно в датасете на вот этой фразе «Уважаемые дамы и господа, дорогие друзья, тема моего обращения.» ошибка какая-то (возможно перепутаны аудиофайлы между собой и с текстом). Завтра буду разбираться с датасетом- все равно хотел улучшить его и фонемы ручками доработать

Roma Romashkin
Да, сохранял промежуточные. Пробовал на них- резул...

У меня три предположения (все довольно тупые, но вдруг): 1. символы или их порядок у моделей отличаются. грубо говоря, где-то зашито, что модель понимает «абвгд…», а теперь грузится чекпоинт, где символы при обучении были в другом порядке, типа «.,?!абвгд…» и модель глючит, потому что при конвертации текста в айдишники получается ерунда 2. выше написано, что модель в продакшн-окружении, если ей синтезируют, не могло ли такое быть, что ей забыли сделать eval() или torch.no_grad и это повлияло? 3. или препроцессинг текста раньше был другой, возможно?

Roma-Romashkin Автор вопроса
Korovsky
У меня три предположения (все довольно тупые, но в...

В итоге выяснил что Продакшн не оказывает влияния. Препроцессинг один и тот же. Удалось выяснить какая фраза вызывает ошибку. Сегодня-завтра пройдусь ещё раз по датасету. Что-то мне кажется где-то произошла ошибка в LJSpeech. Отпишу по результату. Большое спасибо всем участникам за диалог! 🫂

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта