Всем привет. Можно ли как-нибудь вычленить записи отдельных слов из

большого аудио файла? Распознал весь аудиофайл и дал программе поручение: сохранить слово "привет" из этого файла отдельным аудиофайлом.

8 ответов

30 просмотров

Ну да транскрибируйте аудио, и по слову и таймингу режьте аудио тем же ффмпегом

Дениз-Синджар Автор вопроса

а какой хороший сервис прямо тайминг каждого слова хорошо вывести сможет?

Дениз Синджар
а какой хороший сервис прямо тайминг каждого слова...

А самому реализовать это на воск , о выше написали. Несложно ведь.

Дениз Синджар
а какой хороший сервис прямо тайминг каждого слова...

wav2vec умеет вплоть до букв. НО: если распознать без таймстампа, качество получается лучше. Как только таймстапы включаешь ,качество падает

Aigiz K
wav2vec умеет вплоть до букв. НО: если распознать...

А как временные метки на качество повлияли? Вы точно про wav2vec говорите?

Anton
А как временные метки на качество повлияли? Вы точ...

да, сам удивился. вот сам код: logits = model(input_values).logits pred_ids = torch.argmax(logits, axis=-1) outputs = tokenizer.batch_decode(pred_ids, output_char_offsets=True,output_word_offsets=True) и logits = model(waveform).logits pred_ids = torch.argmax(logits, dim=-1)[0] pred_str = processor.decode(pred_ids)

Aigiz K
да, сам удивился. вот сам код: logits = model(inpu...

я очень осторожно предположу, что у вас input_values и waveform - разные фичи

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта