Всем привет Сейчас пробую wav2vec с huggingface столкнулся с проблемой, что

Question

Всем привет Сейчас пробую wav2vec с huggingface столкнулся с проблемой, что

при передаче аудиозаписи модельке - оператива сжирается моментально вся(что в принципе логично)
Предполагаю, что нужно как-то ужимать аудиозапись и разбивать по батчам для распознавания, возможно в каких-то других форматах сохранять

Есть best practices по этому?
У меня цель быстро обрабатывать длинные аудиозаписи

Vosk пробовал две модели из коробки, качество меня не удовлетворило, возможно направите меня в его использовании

#it #russian #speech-recognition

0

08.08.2023

2 ответов

31 просмотр

Egor Staftsev Автор вопроса

Konstantin Dolgikh
А вам только inference модели или её обучение? Есл...

Да, спасибо Стыдно признавать, но в этом проблема и была

0

08.08.2023

Konstantin Dolgikh · Accepted Answer

Konstantin Dolgikh

А вам только inference модели или её обучение? Если только первое, то проверьте, что выполняете код с with torch.no_grad(), возможно, оперативу выжирает расчёт градиентов

0

08.08.2023

26 похожих чатов

Всем привет Сейчас пробую wav2vec с huggingface столкнулся с проблемой, что

2 ответов

Похожие вопросы