https://github.com/mozilla/DeepSpeech/releases/tag/v0.9.1
Хочу совершить speech to text без подключения к сети. То есть все Клауд варианты (от гугла, например) не подходят.
Подходит DS от Мозилы, но не могу найти русскую модель.
Находил форк русский, но там она не собранная. Замороженный граф .pb, а нужен .pbmm
Я в нейросетях не разбираюсь. Я бекенд-разработчик. Спасибо.
P.S. кроме .pbmm там .scorer требуется; Для русской модели тоже нужен свой scorer — "русский"?
https://commonvoice.mozilla.org/en/datasets Вот же Только он какой-то слабый, на 3 гига всего. По сравнению с 50Гб на английском
привет. Возможно в группе подскажут @speech_recognition_ru
Обсуждают сегодня