Здравствуйте! Подскажите куда смотреть (модели опенсорс, локальное некоммерческое использование): 1

задача speech to text. Записи звонков по телефону (русский). Я так понимаю надо смотреть в сторону: vosk ,fairsec.
2 задача выделить из диалога двух говорящих абонентов и построить ембединг их голосов, с целью дальнейшего поиска похожих голосов. Что посоветуете?

5 ответов

15 просмотров

по голосам очень тяжело разделять людей, лучше эту идею отбросить 😉

для второй задачи wavLM вроде неплох. Ну, насколько это возможно вообще)

Hubert умеет строить эмбеддинг спикера, можно потестировать

Nikolay V. Shmyrev
по голосам очень тяжело разделять людей, лучше эту...

а как вот эти господа справляются по вашему? указанные error rates очень приятные https://github.com/pyannote/pyannote-audio

vvv
а как вот эти господа справляются по вашему? указа...

Это для качественных записей для телефона все гораздо хуже

Похожие вопросы

Обсуждают сегодня

Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Немного оффтопа: а кто на чем сидит для осдева в плане ide/редактора? Последнее время сидел на vscode, но я его прям не могу нормально воспринимать, перешел на сlion, но меня...
Evg Resh
29
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
9
День добрый, подскажите пожалуйста, есть ли какой-то способ сказать ребару не компилировать определённое приложение? Всю доку их перечиатл ничего подобного не нашёл
Кирилл
14
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
🙋 Ребята, всем привет. Поправил задачу: Нужно каждому новому сообщению (1 раз по каждому юзеру) в чате прибавлять снизу кнопку с предложением подписаться на канал. Как добавит...
Alexander
1
Вот объясните, как это работает: Вот есть допустим unix-подобная система, и программа запускает допустим printf или fork, как это передается ядру, и как оно обрабатывать начин...
Егор
14
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Всем привет. Сейчас я изучаю erlang по книге Erlang and OTP in action. Дошел до главы где реализуется первый gen server на примере tcp rpc сервера. Меня очень сильно смутил ко...
Freezing Death
12
Ребята, я 3 дня как вкатился в ардуино Думал на прогрессивном молодом языке Rust попилить что-нибудь А как-то грустно с библиотеками оказалось. Не подскажете почему так? Если...
AS Sarb
22
Карта сайта