Есть несколько вопросов по speech recognition api: 1. Сейчас распознанный текст

приходит без пунктуации. Возможно ли попросить сервис расставлять точки/запятые?
2. Сейчас параметр confidence всегда приходит = 1 и в доках почемен как deprecated. Можно ли как-то узнать степень уверенности системы в распознанном слове? Чтобы например отдельно его подсветить в ui.
3. Нет ли возможности разделить текст по спикерам?

7 ответов

21 просмотр

1. Такой возможности нет 2. Можно игнорировать 3. Только если спикеры разделены по разным каналам

Vitaliy-Potapov Автор вопроса
Андрей
1. Такой возможности нет 2. Можно игнорировать 3. ...

Понял, спасибо! А вместо confidence нет ли какого-то способа узнать степень уверенности системы в слове?

Vitaliy Potapov
Понял, спасибо! А вместо confidence нет ли какого-...

можно попробовать сравнивать промежуточные итоги, но готовой метрики сейчас нет, насколько помню

1 и 3 — это задачи для отдельных нейросеток. Например сравнивать на сколько текущий фрагмент речи похож на предыдущий и выдавать предсказание тот ли это голос или другой. Правда при таком наивном подходе вряд ли получится нормально разделить более 2 спикеров.

Vitaliy-Potapov Автор вопроса
Андрей
можно попробовать сравнивать промежуточные итоги, ...

а промежуточные итоги для не-стрим распознавания как-то можно получить? Я использую long running recognize сейчас, и мне приходит только финальный результат.

Vitaliy-Potapov Автор вопроса
Nikolay Matrosov
1 и 3 — это задачи для отдельных нейросеток. Напри...

Это да. Но я думал, что это все внутри спичкита есть) Сейчас для примера загрузил тот же фрагмент в гугл распознавание: и разделение по спикерам, и пунктуация из коробки отработала довольно неплохо.

Vitaliy-Potapov Автор вопроса
Vitaliy Potapov
Это да. Но я думал, что это все внутри спичкита ес...

Разделение по спикерам на 1 канале кстати, т.е. оно по голосу определило

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Карта сайта