@Frappuccino_o я обучаю Vits2 на основе твоих настроек. По сравнению

в с Vits из piper обучение дольше происходит. ты сколько по времени обучал, чтоб получить 170k степ?

19 ответов

24 просмотра

кстати спасибо за совет с MFA aligner, все отлично работает!

Aigiz-K Автор вопроса

да bigvgan. а что за istft, можешь ссылку дать?

Aigiz-K Автор вопроса
Aigiz K
да bigvgan. а что за istft, можешь ссылку дать?

https://github.com/FENRlR/MB-iSTFT-VITS2 нашел, спасибо. буду пробовать

в закрепе https://t.me/speech_recognition_ru/39648

Aigiz-K Автор вопроса

у него там есть мультиязычный cleaner через IPA. Вот если и IPA конвертер воткнуть, то будет вообще круто

Aigiz-K Автор вопроса
Nikolay V. Shmyrev
в закрепе https://t.me/speech_recognition_ru/396...

Очень медленно работает :( Next text: Привет, теперь я могу говорить и по-русски. Как ваши дела? ё-фикация:прив+ет, теп+ерь я мог+у говор+ить и п+о - р+усски. к+ак в+аши д+ела? ё-фикация took 1.7176 seconds.

Aigiz K
Очень медленно работает :( Next text: Привет, теп...

Привет. Я работаю над оптимизацией

Aigiz-K Автор вопроса
datascience xc
И тут же не ефикация

да, там неудачно назвал, мне именно accentizer.process_all(TEXT) нужен

Aigiz K
да, там неудачно назвал, мне именно accentizer.pro...

Ну там главный замедлитель это модель разрешения омографов

Aigiz K
Очень медленно работает :( Next text: Привет, теп...

И ещё лучше по одному предложению подавать

Aigiz-K Автор вопроса
datascience xc
Ну там главный замедлитель это модель разрешения о...

а не лучше ли будет, если разделить слова, которые могут по разному произносится и если они есть, только тогда эту функцию вызывать?

Aigiz-K Автор вопроса
datascience xc
Ну там главный замедлитель это модель разрешения о...

в моем случае: process_yo took 0.0003 seconds. process_omographs took 0.0003 seconds. process_accent took 1.1534 seconds.

Aigiz-K Автор вопроса

использую твои конфиги отсюда https://drive.google.com/drive/folders/1Auyova6g2akKjNtK-KadQampOyOML8jg скорость тренировки не шибко быстрая(если сравнить с piper). за 12 часов 40k steps всего. при этом сравниваю твой результат при 40k и свой. Твой намного лучше

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Aigiz-K Автор вопроса

Стикер

Похожие вопросы

Обсуждают сегодня

что насчет пагинга? на осдеве непонятно(
Vi Chapmann 🪙
26
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
если загрузчик efi? если сама PML4 PDPT PDT PT лежит в неудобном для меня месте?
Vi Chapmann 🪙
8
Всем привет! поделитесь, пож-та, как кто дебажил / решал проблему с 504 Time out ошибкой от nginx, когда стучишься на свой vapor сервер? в логах /var/log/nginx/error.log е...
Paul
24
А я же правильно понимаю, что инструкция AT в ld только сохраняет метаинформации о том, куда загрузить сегмент, которую далее из эльфика читает grub(ну если граб)? Но я тогда ...
Evg Resh
2
Господа, импользую кастомный загрузчик, ядро запускается сразу в длинном режиме, хочу узнать, сколько всего физической ОЗУ есть у машины. И, может, знаете какие-то подводные к...
Vi Chapmann 🪙
6
а причем тут линкер скрипты? UEFI где-то расположила PML4 и прочее, а мне надо переложить её в другое физическое место. как?
Vi Chapmann 🪙
6
Это фейк @cruppto_newbot?
Antskup
13
неужели нету аппаратного метода узнать объём ОЗУ?
Vi Chapmann 🪙
6
Карта сайта