У sherpa-Onnx (и Vosk 0.52) есть hot_words. Их нужно подавать в

файле и каждая строчка там это через пробел разделенные токены.

Вопрос: по какому алгоритму ставить токены (пробовал жадный алгоритм - выбираем на каждом шаге максимально длинный токен из vocab прилагаемого с моделью ).
Проставлял hotwords score разный (от 1.5 до 10).

В итоге фамилия (например Кременчуг) не распознается верно ну ни как.

Или нужно не умничать и всегда задействовать:
```sherpa-onnx-cli text2token``` и передать --bpe-model
?

2 ответов

30 просмотров

вот тут https://huggingface.co/alphacep/vosk-model-ru/tree/main/lang bpe-model взять

Maxim-Usov Автор вопроса
Nikolay V. Shmyrev
вот тут https://huggingface.co/alphacep/vosk-model...

Спасибо! Выдает так: ▁с е вер ный я не добавлял специальный начальный токен 🤦‍♂️

Похожие вопросы

Обсуждают сегодня

Коллеги, я тут для личных нужд пошел ставить MQTT сервер, пощупал mosquitto, но ужаснулся отсутствию такой банальности, как HTTP API для посмотреть список топиков. А тут что,...
Maksim Lapshin
9
Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Немного оффтопа: а кто на чем сидит для осдева в плане ide/редактора? Последнее время сидел на vscode, но я его прям не могу нормально воспринимать, перешел на сlion, но меня...
Evg Resh
29
Как думаете через какой сервис они верифицируют?
inc.
5
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
День добрый, подскажите пожалуйста, есть ли какой-то способ сказать ребару не компилировать определённое приложение? Всю доку их перечиатл ничего подобного не нашёл
Кирилл
14
На чём в основном щас пишут мини апы? Vuejs?
Goot evening Not everyone
6
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
9
А какие существуют способы обработки ошибок выделения памяти в ядре? Т.е., допустим, есть функция, которая возвращает адрес свободной страницы в физической памяти и диапазон в...
disba1ancer
51
Вот объясните, как это работает: Вот есть допустим unix-подобная система, и программа запускает допустим printf или fork, как это передается ядру, и как оно обрабатывать начин...
Егор
14
Карта сайта