могут разделить 2- 3 голоса разных людей в одной аудиозаписи?
Без мл никак вроде)
Про библиотеки не скажу, лет 10 назад к этой задаче применяли 'тензорный поезд'. Такой метод типа свд но для много компонентного тензора
Обсуждают сегодня