сделать, есть куча моделей. Но сложность в том, что это должен быть персонализированный голос, то есть конкретного человека. А данных не так уж и много. Как думаете, прокатит если сначала обучать модель на голосах разных людей, а потом под конец тренировать эту модель голосом конкретного человека? Модель - нейронка.
это одна из возможных тем моего диссера, план года на 3-4. 1. пока в этой области все очень плохо. 2. звук сложнее картинок, хотя бы потому что там мало кто и что работает с сырыми данными
Обсуждают сегодня