Здравствуйте, вот у меня есть кусок аудио разбитый вадом, и

Question

Здравствуйте, вот у меня есть кусок аудио разбитый вадом, и

есть кусок текста в котором есть текст от этого аудио, как мне вытащить из большого текста предложение которое было в аудио?

#it #russian #speech-recognition

0

25.10.2023

6 ответов

59 просмотров

Terа́Spа́ce Stories: 10^12 Space |🥴🤗| Автор вопроса

Aigiz K
порядок текста и аудио совпадает?

по идеи да,но иногда предложение которое в аудио можно иметь лишний текст

0

25.10.2023

Aigiz K

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|
по идеи да,но иногда предложение которое в аудио м...

я выравнивал такой вариант: был текст, разбитый на предложения. диктор между предложениями должна была делать паузу. в итоге получил такие данные: - пропускала некоторые предложения, так как глаз намылился - могла прочитать одно предложение несколько раз, типа если не правильно читала, то перечитывала - так как паузу она делала на глаз, то мне пришлось сперва разбить, если пауза была более 0.5сек, поэтому одно предложение спокойно могло быть разбито на несколько аудиофайлов мой скрипт умеет выравнивать вышеперечисленные случаи. но я потом еще STT проходил и сравнивал, чтоб результат STT на 95% был похож на исходный текст. если такой случай устраивает и подходит, могу расшарить. но скорее завтра, сегодня к серверу доступа нет

0

25.10.2023

Terа́Spа́ce Stories: 10^12 Space |🥴🤗| Автор вопроса

Aigiz K
я выравнивал такой вариант: был текст, разбитый на...

да,было бы славно,спасибо

0

25.10.2023

Aigiz K

Terа́Spа́ce Stories: 10^12 Space |🥴🤗|
да,было бы славно,спасибо

https://github.com/kod-odin/lang-tasks/blob/main/text-to-speech/Aligned%20clean%20and%20wav2vec%20datasets.ipynb

0

26.10.2023