Добрый день. Подскажите, пожалуйста, пытаюсь читать байты файла по чанкам

(условно, по 4000 байт) и переводить их в семплы: [wavfile.read(BytesIO(i)) for i in stream_gen(test)]. Вылетает такая ошибка: ValueError: File format b'\x18\x00\x08\x00' not understood. Only 'RIFF' and 'RIFX' supported. Я правильно понимаю, что чтобы сделать потоковое распознавание нужно на стороне сервиса запоминать заголовок (или самому формировать) и приписывать каждому приходящему чанку, чтобы избегать этой ошибки и получать семплы?

5 ответов

34 просмотра

wavfile для потока не нужен, можно просто читать байты

Max- Автор вопроса
Nikolay V. Shmyrev
wavfile для потока не нужен, можно просто читать б...

Мне espnet==0.10.6 такое пишет, если байты передаю: TypeError: type of argument "speech" must be one of (torch.Tensor, numpy.ndarray); got bytes instead. Не подскажите, что в таком случае можно или правильнее сделать?

Max
Мне espnet==0.10.6 такое пишет, если байты передаю...

https://numpy.org/doc/stable/reference/generated/numpy.frombuffer.html

Max- Автор вопроса
Nikolay V. Shmyrev
https://numpy.org/doc/stable/reference/generated/n...

Спасибо! Так отрабатывает: [speech2text_s(speech=np.frombuffer(i, dtype=np.float32), is_final=False) for i in stream_gen(test)]. Но все предикты nan. И часть значений из данной функции возвращается nan: np.frombuffer(speech1, dtype=np.float32) - мб не так что-то делаю?

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта