Здравствуйте, у меня есть не большой вопрос,у меня в датасете есть самплы где спикер меняет голос что бы озвучить другого,то есть спикер тот же но он не много коверкает голос,...
здравствуйте, вот у меня есть кусок аудио разбитый вадом, и есть кусок текста в котором есть текст от этого аудио, как мне вытащить из большого текста предложение которое бы...
я так понимаю там только квантованые ?
я так понимаю оно режет аудио на куски?
Здравствуйте, а кто-то учил здесь coqui tts для русского?
спрошу еще разок, а что сейчас самое хорошее для риал тайма стт и что бы торч не тянуло, желатльно что бы в onnx?
@nshmyrev ваш воск ттс это же витц? Если да то какие параметры модели использовали? (ну там слои, головки и т д)
разве? ретривер же штука которая идет по тексту и смотри синем близостью на вопрос и если кусок текста похож она его добавляет в ответ
@nshmyrev где можно подробно прочесть про архитектуру воска?
Вопрос может тупой, но почему копирование голоса делают в ттс модельке, а не в вокодере? мне говорили что из за того что вокодеры делают универсальными, но это же не может бы...
Здравствуйте,есть ли нормальные статьи/инструкции про обучение собственного синтеза речи? Заранее спасибо за ответ.
кстати,кто-то знает что под капотом у ElvenLabs tts?
@nshmyrev есть идеи как бы мы могли бы разбить допустим 10 минутное аудио на куски по одному предложению?
@chckdskeasfsd сколько там параметров в ругпт смалл?
@nshmyrev вы обучали EfficientSpeech? если да то как звучит? лучше витца?
знаете что такое полный файнтьюн?
Кто то тут пытался обучить барк? Есть результаты?
а зачем вообще для ттс алайнер?
данные свои какие-то?
есть что то интересное?