Здравствуйте. Использую Vosk английскую модель (версия 0.22) для расшифровки аудиозаписей

конференций. На выходе получаю рандомный набор английских слов, никак не связанный с тем, что говорят в аудиозаписях. Записи не идеального качества, но вполне с четким произношением. На слух понять легко. В чем может быть проблема и можно ли это как-то исправить?

4 ответов

21 просмотр

отличный пример для тестирования распознавания, спасибо!

Dmitry S- Автор вопроса
Nikolay V. Shmyrev
отличный пример для тестирования распознавания, сп...

Спасибо. Буду рад, если это поможет. Ещё возникают моменты следующего плана - если нарезать подобные аудио на части, то распознавание может проходить по-другому. И вполне себе может что-то распознать более корректно. Также, иногда в английской модели почему-то возникает последовательность из нескольких the the the подряд. Понятно, что есть моменты с эхо. Странно, что теряются слова в начале, которые самые простые на слух - Hi. Good afternoon. Good morning to everyone. Thank you so much for joining. Т.е. их вообще нету в выходе модели 0.22

на наших модельках некоторых распознал. Сложно по акустике, но что-то выдает модель 1 • 10:00.72 - 00:59.97 I'm good afternoon good morning everyone thinking so much for joining i've got a great girl on the phone i think has heard preferring had called circle began six eventually join me sixty and looking more or less likely to point taken out and take the time it right on the chest and i think we made a point to duty already read comes over to your money out Rebecca joining me and asked online is undread out just as your concern is only leading teams about a year ago isographs tremendously smear yourself will join up for the holidays we discover one of our new invested the takings artistic quickly castle where the five men today as the inferior land in july and games rubbing two in our send a message • 31:00.00 - 01:09.42 I grow dark brown opposition began a year requisitioning send your day модель 2 • 10:00.75 - 00:59.97 I good afternoon and good morning everyone and thank you so much for joining i've got a record on the phone and i think hazard preparing a column conservative began six annesley Johnny sixty and it's looking more or less sixty so we need you know and take the time Greg bondager the and i think we'll make a point to duty already read come forward and uh here in London he asked Rebecca joining me in an office on line is Andre out addressed as your concern is only about the team about a year ago uh progressed tremendously me to be sure you're so as will join gorilla protocol dare we discuss the ... at the king's artistic quickly castle where the funded today at the reunion through again in July skains roughly hewn out the sun asked uh wanted to make me happy • 31:00.03 - 01:09.42 ... others like even though that crown ... opposition beginning here i love roughly fifteen percent of your day

Dmitry S- Автор вопроса
Mike
на наших модельках некоторых распознал. Сложно по ...

Спасибо. Я уже понял, что файлы у меня не самые простые. А какие вы модели используете? У меня получилось указанный выше файл более менее прилично распознать через Google. Их enhanced phone model. Где то 80% точность получилось не выходе. Не идеально, но более менее из всего что пробовал до этого

Похожие вопросы

Обсуждают сегодня

День добрый, подскажите пожалуйста, есть ли какой-то способ сказать ребару не компилировать определённое приложение? Всю доку их перечиатл ничего подобного не нашёл
Кирилл
14
Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Немного оффтопа: а кто на чем сидит для осдева в плане ide/редактора? Последнее время сидел на vscode, но я его прям не могу нормально воспринимать, перешел на сlion, но меня...
Evg Resh
29
Что за японодичь? Мне хоть m68k, хоть 8080, 8088, на любом можно что-то создать
Егор
5
Вот объясните, как это работает: Вот есть допустим unix-подобная система, и программа запускает допустим printf или fork, как это передается ядру, и как оно обрабатывать начин...
Егор
14
и да, кто сказал что у эпла именно такой isa?
Boris Vinogradov
5
Добрый день. Мне посоветовали обратиться к вам в чат за помощью. Ситуация описана на скрине. Как мне сказали, мне на бота навесили флудвейт. Есть ли возможность снять его ра...
OVERLINK
7
ну так тогда какой эплы юзают набор инструкций, и тогда считаються ли они армами вообще?
Shvabrikk Nya
4
Парни, а никто не пробовал вкорячить сгенерированный CudeMX код в проект раст? Недавно с этим языком ознакомился и возникла мысль, что можно написать скрипт для автоматическо...
NI_isx
11
Карта сайта