Есть несколько вопросов по speech recognition api: 1. Сейчас распознанный текст

Question

Есть несколько вопросов по speech recognition api: 1. Сейчас распознанный текст

приходит без пунктуации. Возможно ли попросить сервис расставлять точки/запятые?
2. Сейчас параметр confidence всегда приходит = 1 и в доках почемен как deprecated. Можно ли как-то узнать степень уверенности системы в распознанном слове? Чтобы например отдельно его подсветить в ui.
3. Нет ли возможности разделить текст по спикерам?

#database #russian #software #yandex-cloud

0

11.10.2021

7 ответов

43 просмотра

Vitaliy Potapov Автор вопроса

Андрей
1. Такой возможности нет 2. Можно игнорировать 3. ...

Понял, спасибо! А вместо confidence нет ли какого-то способа узнать степень уверенности системы в слове?

0

11.10.2021

Андрей

Vitaliy Potapov
Понял, спасибо! А вместо confidence нет ли какого-...

можно попробовать сравнивать промежуточные итоги, но готовой метрики сейчас нет, насколько помню

0

11.10.2021

Nikolay Matrosov

1 и 3 — это задачи для отдельных нейросеток. Например сравнивать на сколько текущий фрагмент речи похож на предыдущий и выдавать предсказание тот ли это голос или другой. Правда при таком наивном подходе вряд ли получится нормально разделить более 2 спикеров.

0

11.10.2021

Vitaliy Potapov Автор вопроса

Андрей
можно попробовать сравнивать промежуточные итоги, ...

а промежуточные итоги для не-стрим распознавания как-то можно получить? Я использую long running recognize сейчас, и мне приходит только финальный результат.

0

11.10.2021

Vitaliy Potapov Автор вопроса

Nikolay Matrosov
1 и 3 — это задачи для отдельных нейросеток. Напри...

Это да. Но я думал, что это все внутри спичкита есть) Сейчас для примера загрузил тот же фрагмент в гугл распознавание: и разделение по спикерам, и пунктуация из коробки отработала довольно неплохо.

0

11.10.2021

Vitaliy Potapov Автор вопроса

Vitaliy Potapov
Это да. Но я думал, что это все внутри спичкита ес...

Разделение по спикерам на 1 канале кстати, т.е. оно по голосу определило

0

11.10.2021

Андрей · Accepted Answer

Андрей

1. Такой возможности нет 2. Можно игнорировать 3. Только если спикеры разделены по разным каналам

0

11.10.2021

61 похожих чатов

Есть несколько вопросов по speech recognition api: 1. Сейчас распознанный текст

7 ответов

Похожие вопросы