@Frappuccino_o я обучаю Vits2 на основе твоих настроек. По сравнению

в с Vits из piper обучение дольше происходит. ты сколько по времени обучал, чтоб получить 170k степ?

19 ответов

48 просмотров

кстати спасибо за совет с MFA aligner, все отлично работает!

Aigiz-K Автор вопроса

да bigvgan. а что за istft, можешь ссылку дать?

Aigiz-K Автор вопроса
Aigiz K
да bigvgan. а что за istft, можешь ссылку дать?

https://github.com/FENRlR/MB-iSTFT-VITS2 нашел, спасибо. буду пробовать

в закрепе https://t.me/speech_recognition_ru/39648

Aigiz-K Автор вопроса

у него там есть мультиязычный cleaner через IPA. Вот если и IPA конвертер воткнуть, то будет вообще круто

Aigiz-K Автор вопроса
Nikolay V. Shmyrev
в закрепе https://t.me/speech_recognition_ru/396...

Очень медленно работает :( Next text: Привет, теперь я могу говорить и по-русски. Как ваши дела? ё-фикация:прив+ет, теп+ерь я мог+у говор+ить и п+о - р+усски. к+ак в+аши д+ела? ё-фикация took 1.7176 seconds.

Aigiz K
Очень медленно работает :( Next text: Привет, теп...

Привет. Я работаю над оптимизацией

Aigiz-K Автор вопроса
datascience xc
И тут же не ефикация

да, там неудачно назвал, мне именно accentizer.process_all(TEXT) нужен

Aigiz K
да, там неудачно назвал, мне именно accentizer.pro...

Ну там главный замедлитель это модель разрешения омографов

Aigiz K
Очень медленно работает :( Next text: Привет, теп...

И ещё лучше по одному предложению подавать

Aigiz-K Автор вопроса
datascience xc
Ну там главный замедлитель это модель разрешения о...

а не лучше ли будет, если разделить слова, которые могут по разному произносится и если они есть, только тогда эту функцию вызывать?

Aigiz-K Автор вопроса
datascience xc
Ну там главный замедлитель это модель разрешения о...

в моем случае: process_yo took 0.0003 seconds. process_omographs took 0.0003 seconds. process_accent took 1.1534 seconds.

Aigiz-K Автор вопроса

использую твои конфиги отсюда https://drive.google.com/drive/folders/1Auyova6g2akKjNtK-KadQampOyOML8jg скорость тренировки не шибко быстрая(если сравнить с piper). за 12 часов 40k steps всего. при этом сравниваю твой результат при 40k и свой. Твой намного лучше

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Похожие вопросы

Обсуждают сегодня

Как думаете через какой сервис они верифицируют?
inc.
5
Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Немного оффтопа: а кто на чем сидит для осдева в плане ide/редактора? Последнее время сидел на vscode, но я его прям не могу нормально воспринимать, перешел на сlion, но меня...
Evg Resh
29
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
День добрый, подскажите пожалуйста, есть ли какой-то способ сказать ребару не компилировать определённое приложение? Всю доку их перечиатл ничего подобного не нашёл
Кирилл
14
На чём в основном щас пишут мини апы? Vuejs?
Goot evening Not everyone
6
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
9
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Вот объясните, как это работает: Вот есть допустим unix-подобная система, и программа запускает допустим printf или fork, как это передается ядру, и как оно обрабатывать начин...
Егор
14
Всем привет. Сейчас я изучаю erlang по книге Erlang and OTP in action. Дошел до главы где реализуется первый gen server на примере tcp rpc сервера. Меня очень сильно смутил ко...
Freezing Death
12
Карта сайта