Или я не догоняю о чем речь? 🤷‍♂️ еще раз есть аудио там

Question

Или я не догоняю о чем речь? 🤷‍♂️ еще раз есть аудио там

говорят два человека

задача из аудио получить текст, но текст должен быть разделен по спикерам

к примеру массив текста - спикер №1
к примеру массив текста - спикер №2

Возьмем аудио (формально)🤷‍♂️

"Здравствуйте! Звонили?" (спикер №1)

"Да, звонил" (спикер №2)

Получить необходимо следующее:

speaker1: ['здравствуйте', 'звонили']
speaker2: ['да', 'звонил']

0

24.07.2019

2 ответов

34 просмотра

Пользователь 61937

Есть софтина которая делает разбивку по спикерам и выдаёт транскрипт. Я тестировал она работает неплохо. Основное требование нужно писать звук одновременно с двух телефонов. Я не уверен поможет ли это в вашем случае, с аудио файлом. Но как пример где есть довольно качественный speaker diarization думаю подойдёт. Возможно есть в open source алгоритм который используя 2 аудио стрима может вычленять speaker’ов. https://reason8.ai/

0

24.07.2019

Mess Effect 181602.50 · Accepted Answer

Mess Effect 181602.50

Мне нужно тоже самое только для польского

0

24.07.2019

Похожие чаты

Или я не догоняю о чем речь? 🤷‍♂️ еще раз есть аудио там

2 ответов

Похожие вопросы