Я в тему только погружаюсь(ускоренно) и возникли вопросы.
Нашел два метода работы, это просто векторизация аудио дорожки и прям так ее подаём на вход, второй способ это построение графика спектра и работа с ним как с картинкой. Кто может подсказать?
А что классифицировать?
У меня не звук, но тоже временной ряд и тоже использую сверточную сеть. Компактную, всюду плотную - DenseNet
Обсуждают сегодня