@Frappuccino_o я обучаю Vits2 на основе твоих настроек. По сравнению

в с Vits из piper обучение дольше происходит. ты сколько по времени обучал, чтоб получить 170k степ?

19 ответов

52 просмотра

кстати спасибо за совет с MFA aligner, все отлично работает!

Aigiz-K Автор вопроса

да bigvgan. а что за istft, можешь ссылку дать?

Aigiz-K Автор вопроса
Aigiz K
да bigvgan. а что за istft, можешь ссылку дать?

https://github.com/FENRlR/MB-iSTFT-VITS2 нашел, спасибо. буду пробовать

в закрепе https://t.me/speech_recognition_ru/39648

Aigiz-K Автор вопроса

у него там есть мультиязычный cleaner через IPA. Вот если и IPA конвертер воткнуть, то будет вообще круто

Aigiz-K Автор вопроса
Nikolay V. Shmyrev
в закрепе https://t.me/speech_recognition_ru/396...

Очень медленно работает :( Next text: Привет, теперь я могу говорить и по-русски. Как ваши дела? ё-фикация:прив+ет, теп+ерь я мог+у говор+ить и п+о - р+усски. к+ак в+аши д+ела? ё-фикация took 1.7176 seconds.

Aigiz K
Очень медленно работает :( Next text: Привет, теп...

Привет. Я работаю над оптимизацией

Aigiz-K Автор вопроса
datascience xc
И тут же не ефикация

да, там неудачно назвал, мне именно accentizer.process_all(TEXT) нужен

Aigiz K
да, там неудачно назвал, мне именно accentizer.pro...

Ну там главный замедлитель это модель разрешения омографов

Aigiz K
Очень медленно работает :( Next text: Привет, теп...

И ещё лучше по одному предложению подавать

Aigiz-K Автор вопроса
datascience xc
Ну там главный замедлитель это модель разрешения о...

а не лучше ли будет, если разделить слова, которые могут по разному произносится и если они есть, только тогда эту функцию вызывать?

Aigiz-K Автор вопроса
datascience xc
Ну там главный замедлитель это модель разрешения о...

в моем случае: process_yo took 0.0003 seconds. process_omographs took 0.0003 seconds. process_accent took 1.1534 seconds.

Aigiz-K Автор вопроса

использую твои конфиги отсюда https://drive.google.com/drive/folders/1Auyova6g2akKjNtK-KadQampOyOML8jg скорость тренировки не шибко быстрая(если сравнить с piper). за 12 часов 40k steps всего. при этом сравниваю твой результат при 40k и свой. Твой намного лучше

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта