Народ - подскажите - это поможет аудиокнигу разметить (подготовить

) для обучения модели ? https://github-com.translate.goog/qiuqiangkong/audioset_tagging_cnn?_x_tr_sl=en&_x_tr_tl=ru&_x_tr_hl=ru&_x_tr_pto=sc

4 ответов

6 просмотров

нет

Олег-Светов Автор вопроса
Nikolay V. Shmyrev
нет

а это ? ( ... AudioTagging 2. Архитектура системы Идеальным решением при проектировании системы автоматической разметки аудиоданных будет пайплайн, состоящий из VAD(Voice Active Detection), ASR(Automatic Speech Recognition) и AudioTagging моделей. 3. VAD Для реализации рассматриваемой задачи прежде всего необходимо получить возможность извлекать из входного аудиопотока речь, отбрасывая компоненты к ней не относящиеся. Таковыми могут быть затяжные паузы, фоновые шумы, смех, кашель и т.д.   Для обучения VAD модели обучающие данные должны включать в себя как минимум два класса: речь и не-речь. Общее количество данных небольшое, около 15-20 часов. Однако в результате проведенных экспериментов было выявлено, что деления на 2 класса недостаточно, процент ошибки у модели весьма высок. В связи с чем было принято решение сформировать три класса данных: Speech, background noise, silence. ) https://github.com/topics/audio-tagging

Олег-Светов Автор вопроса

Похожие вопросы

Обсуждают сегодня

Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Кто-нибудь знает, как считается нагрузка на цпу? И что такое вообще "нагрузка на цпу"? вот, например, есть у цпу какой-то clock, настроенный на 3 ГГц --- Что значит "нагрузка...
Toideng
15
Всем привет! поделитесь, пож-та, как кто дебажил / решал проблему с 504 Time out ошибкой от nginx, когда стучишься на свой vapor сервер? в логах /var/log/nginx/error.log е...
Paul
24
Гуру lldb имеются?) Пробую себя в дебаге и реверсе на примере функции _CFProcessPath. Ставлю брейкпоинт по названию, и выполнение программы на ней приостанавливается. Дальше ...
Сергей Романенко
1
ребят, привет. за какое время бот полученную заявку на вступление в группу может принять \отклонить? Помню речь была про 5 минут, сейчас как?
Роман Ромашин :)
10
Я тут пытаюсь переработать архитектуру подсистемы памяти ядра во что-то осмысленное. Есть pmm, который создает набор range’ей(пока что только для ядра, потом для юзерспейса), ...
Evg Resh
19
Доброго времени суток. Правильно ли я понимаю, что с введением новой платежной единицы stars, я просто могу оставить текущую платёжку от Юкассы, которая выполняется на сайте с...
Prokhor Chulkov
7
Кто то писал чат на VAPOR+grpc стримах?
iEvgen =MH=
8
чтобы получить инструкцию о том, куда шурупы вкручивать у кулера?
Toideng
7
Карта сайта