Здравствуйте! Подскажите куда смотреть (модели опенсорс, локальное некоммерческое использование): 1

задача speech to text. Записи звонков по телефону (русский). Я так понимаю надо смотреть в сторону: vosk ,fairsec.
2 задача выделить из диалога двух говорящих абонентов и построить ембединг их голосов, с целью дальнейшего поиска похожих голосов. Что посоветуете?

5 ответов

11 просмотров

по голосам очень тяжело разделять людей, лучше эту идею отбросить 😉

для второй задачи wavLM вроде неплох. Ну, насколько это возможно вообще)

Hubert умеет строить эмбеддинг спикера, можно потестировать

Nikolay V. Shmyrev
по голосам очень тяжело разделять людей, лучше эту...

а как вот эти господа справляются по вашему? указанные error rates очень приятные https://github.com/pyannote/pyannote-audio

vvv
а как вот эти господа справляются по вашему? указа...

Это для качественных записей для телефона все гораздо хуже

Похожие вопросы

Обсуждают сегодня

А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Коллеги, доброе утро. Запустил на удаленном хосте приложение (ручками зашел туда по ssh и запустил, не командой удаленно). Создал потом ssh-туннель, и с моей машины приложение...
Δημήτηρ
9
а я честно сказать не понимаю - нахуя идти учиться на вышку или еще куда-либо и при этом нихуя не делать, типа зачем ? просто корку получить, а нахуй она нужна тогда ?
Eugene Неелов
7
> Примечательно, что новый владелец удаляет из GitHub любые жалобы, указывающие на подозрительную активность или смену владельца, и, видимо, рассчитывает на то, что пользовате...
Alex Sherbakov
2
Which companies do you think are innovating best in web design and design practices?
✌️(´ヮ`)
6
я часов 15 назад начал пытаться написать хоть что-то напоминающее ос и у меня есть проблема, которую я пытаюсь решить последние часов 5: есть крч 2 исходника с минимальным код...
Al1to
17
Коллеги, добрый день. Есть такой вопрос: Есть модуль, который надо запустить через супервизор как дочерний процесс. Пока инстансов было нужно 8, всё было окей, но когда их ст...
Δημήτηρ
4
А его полностью надо брать, или как отдает epmd?
Δημήτηρ
5
может сразу такое банить?
Maksim Lapshin
4
я бы даже сказал не размер резюме, а слова, которые там написаны, потому что резюме может быть на несколько десятков страниц из-за 20 летнего опыта работы, но там в опыте буде...
Eugene Неелов
2
Карта сайта