Привет! Все ищу, никак не могу найти. Кто знает какие

Question

Распознавание и синтез речи

Асоквер C6H4C12 #катякурица

Привет! Все ищу, никак не могу найти. Кто знает какие

то мульти-языковые STT(speech to text), с поддержкой русского языка? whisper сразу отпадает

#it #russian #speech-recognition

0

25.09.2023

5 ответов

66 просмотров

Асоквер C6H4C12 #катякурица Автор вопроса

Nikolay V. Shmyrev
Других нет хороших. Почему виспер отпадает и почем...

Виспер отпадает, ибо для его использования нужен объем VRAM. Саму модель я хотел использовать на впс без гпу. Ну а для каждого языка свою модель использовать - дело в том, что входные данные для модели будут не только на русском языке, возможно с вставками английского, украинского, казахского и японского

0

25.09.2023

Vlad

Асоквер C6H4C12 #катякурица
Виспер отпадает, ибо для его использования нужен о...

Как вариант, можете взять vosk и данные слать сразу в несколько моделей на нужных языках, а далее сравнивать текст. Сам не пробовал, но это первое что пришло в голову, т.к. мультиязычных моделей ASR с сопоставимым качеством, как у моноязычных, попросту нету

0

25.09.2023

Roma Romashkin

Асоквер C6H4C12 #катякурица
Виспер отпадает, ибо для его использования нужен о...

api в помощь.. Господа, подскажите чем вы размечаете аудио-массив для нарезки семплов?

0

25.09.2023

Alexandr Kardapolov Ekb

Асоквер C6H4C12 #катякурица
Виспер отпадает, ибо для его использования нужен о...

whisper.cpp на CPU?

0

25.09.2023