Здравствуйте, вот у меня есть кусок аудио разбитый вадом, и

есть кусок текста в котором есть текст от этого аудио, как мне вытащить из большого текста предложение которое было в аудио?

6 ответов

33 просмотра

порядок текста и аудио совпадает?

Aigiz K
порядок текста и аудио совпадает?

по идеи да,но иногда предложение которое в аудио можно иметь лишний текст

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|
по идеи да,но иногда предложение которое в аудио м...

я выравнивал такой вариант: был текст, разбитый на предложения. диктор между предложениями должна была делать паузу. в итоге получил такие данные: - пропускала некоторые предложения, так как глаз намылился - могла прочитать одно предложение несколько раз, типа если не правильно читала, то перечитывала - так как паузу она делала на глаз, то мне пришлось сперва разбить, если пауза была более 0.5сек, поэтому одно предложение спокойно могло быть разбито на несколько аудиофайлов мой скрипт умеет выравнивать вышеперечисленные случаи. но я потом еще STT проходил и сравнивал, чтоб результат STT на 95% был похож на исходный текст. если такой случай устраивает и подходит, могу расшарить. но скорее завтра, сегодня к серверу доступа нет

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|
да,было бы славно,спасибо

https://github.com/kod-odin/lang-tasks/blob/main/text-to-speech/Aligned%20clean%20and%20wav2vec%20datasets.ipynb

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта