гауссовский случайный вектор к входному сигналу, но ведь в условиях реальных данных шумы могут быть более сложно устроены (на самом деле интересно узнать, какие помехи встречаются для разных микрофонов, можно ли их как-то классифицировать/характеризовать?)
Существуют ли какие-нибудь тулзы для питона, чтобы делать какие-то более «разнообразные» аугментации шума? Мб есть шумовые датасеты, которые можно было бы подсунуть как бэкграунд к исходному аудио?
Датасет отсюда будет полезен: https://github.com/microsoft/DNS-Challenge
Наверное, самые популярные аугментации — это SpecAugment.
Обсуждают сегодня