чтобы разные языки, включая русский. И чтобы можно было голос выбирать.
Пишу сюда так как в ods не отвечают.
Попробуй bark, но если честно качество оставляет желать лучшего, проприетарный elevenlabs будет покруче.
тебе бы в профильный чат
В профильном тишина. Тут тоже есть ребята с ml и живее как то общение
Ну вот да, качество бы норм хотелось, чтобы хотя бы слова не путал. Пусть говорит как робот, но точно как просили
Я пока накидал такие в список: Coqui tts Elevenlabs tts Silero
Посмотри пример тут huggingface bark, и потестируй, мб тебе звук и подойдёт. На счёт silero, пробовал, в принципе неплохо, но elevenlabs больше нравится. Хотя мне кажется, что TTS на русском в целом немного утопия, все таки фонемы у нас посложнее если сравнивать с английским, в связи с этим речь получается так себе. Как вариант, можешь копнуть в сторону so-vits-svc, это больше про клонирование, нежели TTS, но из личного опыта скажу так, тренировал модель с голосом профессионального диктора, 3000 эпох и речь в принципе получается неплохая. Дальше тренировать не хватает мощности.
Обсуждают сегодня