языком, показывают хорошие результаты на практике(короткие голосовые сообщения - короткие тексты)? Задачи: голос => текст, потом текст => голос.
Ну для распознавания vosk, nvidia rnnt. Для синтеза TeraTTS, vosk-tts, silero
Спасибо большое! 🙏
Обсуждают сегодня