стриме? Т.е. не дожидаться когда пользователь закончит говорить, а распознавать уже во время речи
Воск, виспер… всё равно тамфрейм будет нужен за который переводить и исходя из которого строиться будет контекст перевода
Виспер на костылях через файл работает в потоке. Так и стрим(например с микро) идёт на самом деле через фреймы данных, а не каждый байт по отдельности)
Где-то на гитхабе видел работу со стримом не через файл… к сожалению не найду, на питоне решение было
Виспер? Ищи в этом чате выше, скидывали ссылку. Мне лень за вас информацию искать. Извиняюсь, перепутал адресата
Мне-то зачем? Я что ли вопрос задавал…
Перепутал адресата) я для того, кто спрашивал
Виспер работаетисключитьельно с кусками в 30 секунд речи. Если давать меньше - то они дополняются тишиной. Стрим надо резать самому на куски в 30 секунд найдя паузу
Обсуждают сегодня