классификации. Существует 26 признаков и 27-ой label
Столбец лейбл содержит либо 0 либо 1.
Есть 10тыс строк, и каждой строке соответствует либо 0 либо 1.
Данные представляют последовательность, то есть каждый элемент связан с следующим по смыслу (данные представляют извлеченные признаки звуковых фрагментов длительностью 3 секунды)
В связи с этим есть 3 вопроса:
1. Разумно-ли использовать модель LSTM вообще ? После многократных попыток настроить ее гиперпараметры - результат не удовлетворяет или я его не правильно интерпретирую, отсюда вытекает второй вопрос:
2. Каким образом модель предсказывает целевую переменную, если учитывать тот факт, что лейбл был разделен на два столбца с помощью to_categorical ( возвращает массив содержащий принадлежность к классу Fake или Real, где 0 - значит не принадлежит, а 1 принадлежит)
Например 34 строка имеет real 1 соответственно fake 0
Модель будет возвращать массив с двумя значениями, которые представляют уверенность модели в принадлежности к одному из классов ? Или я путаю тут что-то ?
3. вопрос связан с перемешиванием данных: верно-ли мое решение перемешать данные, которые изначально представляют последовательность ?
Если что-то покажется очень непонятным, я могу объяснить все по-другому.
https://habr.com/ru/articles/672094/ вроде такой задачи?
Да, я рассматривал эти три статьи про обработку звука.
А пришли дату
https://www.kaggle.com/datasets/birdy654/deep-voice-deepfake-voice-recognition
Обсуждают сегодня