это еще и декодить надо. И трафика больше. А что вообще передается?
суть в том, что на бек надо передавать голос юзера, сохранять его в файл, файл нормализировать с помощью фильтра и отправить в гугл на распознавание речи
байты тоже подойдут, в принципе
По браузерам есть требования?
пока что мвп, поэтому нет
не совсем
Да. Можно speech recognition браузера юзать.
https://developer.mozilla.org/ru/docs/Web/API/Web_Speech_API/Using_the_Web_Speech_API
это и будем юзать, но это стриминг же, нужно как-то чанки нарезать именно...
с этим вот проблема
Это можно на клиенте делать. В смысле, распознавание речи.
там на беке сложная логика по обработке
вообще я тоже об этом думал, но нет... нужно таки на бек слать
Обсуждают сегодня