А что вы хотите получить на выходе? все 100% аудио

содержат эмоции.

6 ответов

26 просмотров

хотел оценить записи разговоров на нейтральные (обычные) и возбужденные (там где много эмоций ор крики и на подобии)

Ilya Abramchuk
хотел оценить записи разговоров на нейтральные (об...

Возможно вам подойдет просто кластеризация на два класса по MFB - если вы ожидаете в своих записях крики и эмоции - там просто будут большие значения энергий, мб на части фильтрбанков. Если хотите прям сетки, можно скажем https://github.com/s3prl/s3prl/tree/master/s3prl/downstream/emotion

Алексей Гусев
Возможно вам подойдет просто кластеризация на два ...

я хочу просто чтобы работало) кластеризация по mfb это какой-то вид мел коэффициентов?

Алексей Гусев
mfb - mel filter bank

спасибо, я правильно понял, что вы предлагаете перевести аудио в какой-либо вид мел представлений и там просто отделить по аудио с высокими значениями от аудио с низкими значениями?

Ilya Abramchuk
спасибо, я правильно понял, что вы предлагаете пер...

пройтись VAD, по речи построить MFB и по ним попытаться найти громких эмоциональных людей. Разумеется останутся еще тихие эмоциональные люди и громкие спокойные. Еще разумно предположить, что данных с эмоциональной речью будет сильно меньше, чем с обычной - нужно думать, что с этим делать

Похожие вопросы

Обсуждают сегодня

Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
2
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Коллеги, я тут для личных нужд пошел ставить MQTT сервер, пощупал mosquitto, но ужаснулся отсутствию такой банальности, как HTTP API для посмотреть список топиков. А тут что,...
Maksim Lapshin
14
У меня задача: написать брокер сообщений. Очереди и потребители. Очереди поддерживают приоритеты. Очередь отдает сообщения, только обработчикам с соответствующими характеристи...
Aleksandr Filippov
2
Немного оффтопа: а кто на чем сидит для осдева в плане ide/редактора? Последнее время сидел на vscode, но я его прям не могу нормально воспринимать, перешел на сlion, но меня...
Evg Resh
29
Карта сайта