для функции librosa.feature.mfcc, если мне нужно переобучить нейросеть на коротких аудиодорожках по 150 микросекунд вместо 5 секунд и снижении sample_rate с 22050 до 8000? Целесобразно ли использовать hop length равным 64 вместо 512, например?
Попробуйте задать этот вопрос здесь: https://t.me/speech_recognition_ru
Обсуждают сегодня