Здравствуйте. Использую Vosk английскую модель (версия 0.22) для расшифровки аудиозаписей

конференций. На выходе получаю рандомный набор английских слов, никак не связанный с тем, что говорят в аудиозаписях. Записи не идеального качества, но вполне с четким произношением. На слух понять легко. В чем может быть проблема и можно ли это как-то исправить?

4 ответов

24 просмотра

отличный пример для тестирования распознавания, спасибо!

Dmitry S- Автор вопроса
Nikolay V. Shmyrev
отличный пример для тестирования распознавания, сп...

Спасибо. Буду рад, если это поможет. Ещё возникают моменты следующего плана - если нарезать подобные аудио на части, то распознавание может проходить по-другому. И вполне себе может что-то распознать более корректно. Также, иногда в английской модели почему-то возникает последовательность из нескольких the the the подряд. Понятно, что есть моменты с эхо. Странно, что теряются слова в начале, которые самые простые на слух - Hi. Good afternoon. Good morning to everyone. Thank you so much for joining. Т.е. их вообще нету в выходе модели 0.22

на наших модельках некоторых распознал. Сложно по акустике, но что-то выдает модель 1 • 10:00.72 - 00:59.97 I'm good afternoon good morning everyone thinking so much for joining i've got a great girl on the phone i think has heard preferring had called circle began six eventually join me sixty and looking more or less likely to point taken out and take the time it right on the chest and i think we made a point to duty already read comes over to your money out Rebecca joining me and asked online is undread out just as your concern is only leading teams about a year ago isographs tremendously smear yourself will join up for the holidays we discover one of our new invested the takings artistic quickly castle where the five men today as the inferior land in july and games rubbing two in our send a message • 31:00.00 - 01:09.42 I grow dark brown opposition began a year requisitioning send your day модель 2 • 10:00.75 - 00:59.97 I good afternoon and good morning everyone and thank you so much for joining i've got a record on the phone and i think hazard preparing a column conservative began six annesley Johnny sixty and it's looking more or less sixty so we need you know and take the time Greg bondager the and i think we'll make a point to duty already read come forward and uh here in London he asked Rebecca joining me in an office on line is Andre out addressed as your concern is only about the team about a year ago uh progressed tremendously me to be sure you're so as will join gorilla protocol dare we discuss the ... at the king's artistic quickly castle where the funded today at the reunion through again in July skains roughly hewn out the sun asked uh wanted to make me happy • 31:00.03 - 01:09.42 ... others like even though that crown ... opposition beginning here i love roughly fifteen percent of your day

Dmitry S- Автор вопроса
Mike
на наших модельках некоторых распознал. Сложно по ...

Спасибо. Я уже понял, что файлы у меня не самые простые. А какие вы модели используете? У меня получилось указанный выше файл более менее прилично распознать через Google. Их enhanced phone model. Где то 80% точность получилось не выходе. Не идеально, но более менее из всего что пробовал до этого

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта