(10 жанров).
Сетка обучалась на записях длинной в 6 секунд.
Данные подготваливались методом librosa.feature.mfcc, при этом
sample_rate = 22050
n_fft = 2048
n_mfcc = 13
hop_length = 512
Сейчас нужно переобучить нейросеть, чтобы она была способна работать с дорожками длинной в 150 милисекунд c сэмплированием в 8 кГц.
Будет ли правильным ставить hop_lenght равным 64, например?
Какие лучше всего поставить парамтеры в текущем случае?
Спасибо
Если fft делать 512, то перекрытие можно 128, 64 маловато. Вообще все текущие цифры примерно на 3 делятся, а не на 8
Обсуждают сегодня