Всем привет! Сейчас я пытаюсь обучить VITS в Cocui TTS

на датасете Руслан чтобы в последствии дообучить на данных другого голоса чтобы скопировать этот конкретный голос, например Сидоровича из Сталкера.
Я хочу обучить где то на 60к шагов и в конце у меня получатся эти 2 файлика.
Получится ли у меня скопировать конкретный голос Сидоровича если я дообучу обученную на Руслане VITS?

11 ответов

81 просмотр
gigachad- Автор вопроса

часов?? дай бог минут 6

gigachad
часов?? дай бог минут 6

Может на них обучить вокодер, а потом завокодить руслана?

gigachad
всмысле, это как

Какой-нибудь svc-4.0

gigachad- Автор вопроса

а он быстро преобразует текст в речь? просто в итоге со всеми оптимизациями мне нужен ответ менее чем за 3 сек

gigachad
а он быстро преобразует текст в речь? просто в ито...

Вы не поняли. Это вокодер. Он преобразует один голос в другой грубо говоря

gigachad- Автор вопроса

Это как то много датасетов и ресурсов займёт для одного голоса, я с трудом пытаюсь обучить 60к шагов VITS на Руслане.

gigachad
Это как то много датасетов и ресурсов займёт для о...

С ходу не скажу. У меня эксперименты на 4090 заняли 3-4 часа

gigachad
Это как то много датасетов и ресурсов займёт для о...

Скажем так: диктор где то месяц записывает. За этот месяц мы можем каждый день новый голос синтезировать

gigachad
Это как то много датасетов и ресурсов займёт для о...

Ну смотрите. Вокодер у меня на 4090 обучился где-то за 2-3 часа (с учётом неудач). Весь датасет который по размеру как Руслан прогнался через вокодер за 30-40 минут

gigachad- Автор вопроса
datascience xc
Ну смотрите. Вокодер у меня на 4090 обучился где-т...

мне не особо такое подходит и если возможно нужен другой вариант

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта