на базе искусственного интеллекта P. S. Наши open source наработки доступны тут: наш GitHub ( https://github.com/sovaai?utm_source=habr&utm_medium=article&utm_campaign=how_we_do_speech&utm_content=link_footer&utm_term=sova_github )
Распознавание речи: SOVA ASR
Датасет для распознавания речи: SOVA Dataset
Синтез речи: SOVA TTS
С 21го года много воды утекло :)
Куда утекло ? 😁 Подскажите - откуда код брать 😁😁🖐
Как обычно, в песок. Не уверен что asr с кодом двухлетней давности сейчас хорош. А на некоторых доменах так точно не очень.
Поэтому и вопрос - поинтересней не попадалось ?
Из открытого свежий воск, силеро, speechbrain (но его файнтюнить надо, из коробки не вариант), whisper нужно сильно готовить до хорошего качества, и то все равно склонен галлюцинировать.
Обсуждают сегодня