🔉Раскрываем секрет идеального звука Станции 2 Вы замечали, что в разных помещениях одна и та же песня может звучать совершенно по-разному? На акустику влияют не только размер...
Голос Digalo "Николай" под RHVoice Наша команда "RHVoice Lab" экспериментировала-экспериментировала, да и натренировала синтезатор речи для синтезатора речи. Голос Digalo Ни...
На канале AGI интересная ссылка, целый патент организовался тут у некоторых СПОСОБ И СИСТЕМА АНАЛИЗА ГОЛОСОВЫХ ВЫЗОВОВ НА ПРЕДМЕТ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ СОЦИАЛЬНОЙ ИНЖЕНЕ...
> Подскажите, пожалуйста, как обычно (кроме метода тыка) выбирают количество слоев енкодера и декодера в моделях распознавания речи (трансформер, конформеры и прочие rnn)? Об...
> кто знает, как в этой модели добавить задачу translation в коде на python? results = model.transcribe("video.mkv", language="ja", task="translate")
cublas точно подходящей версии?
Model.close() вызываете?
Звук проигрываемый что-ли надо записать? Для этого надо настраивать устройство записи
а в файле что? скорее всего файл неправильного формата
микрофон-то близко стоит или далеко от человека?
https://github.com/NVIDIA/NeMo/blob/main/docs/source/asr/models.rst?plain=1#L202
Хотел себе, кстати, недавно телефон взять, eOS поставить, попробовать f-droid с распознаванием интегрировать. Чего-то нет даже моделей нормальных. У самсунгов бутлоадер залоче...
128 это что?
никто Unreal Engine насчёт звукового ввода не мучал? Почему там задержки по несколько секунд по записи звука?
просто обрабатывать текст распознанный, сбрасывать-то зачем?
https://www.youtube.com/watch?v=61ytTdmbgSs
А кто в ЦРТ-то остался?
И где тут рвётся соединение?
двойные буквы объединять?
воск?