есть кусок текста в котором есть текст от этого аудио, как мне вытащить из большого текста предложение которое было в аудио?
порядок текста и аудио совпадает?
по идеи да,но иногда предложение которое в аудио можно иметь лишний текст
я выравнивал такой вариант: был текст, разбитый на предложения. диктор между предложениями должна была делать паузу. в итоге получил такие данные: - пропускала некоторые предложения, так как глаз намылился - могла прочитать одно предложение несколько раз, типа если не правильно читала, то перечитывала - так как паузу она делала на глаз, то мне пришлось сперва разбить, если пауза была более 0.5сек, поэтому одно предложение спокойно могло быть разбито на несколько аудиофайлов мой скрипт умеет выравнивать вышеперечисленные случаи. но я потом еще STT проходил и сравнивал, чтоб результат STT на 95% был похож на исходный текст. если такой случай устраивает и подходит, могу расшарить. но скорее завтра, сегодня к серверу доступа нет
да,было бы славно,спасибо
https://github.com/kod-odin/lang-tasks/blob/main/text-to-speech/Aligned%20clean%20and%20wav2vec%20datasets.ipynb
Обсуждают сегодня