215 похожих чатов

Всем привет! Начинаю изучать ML. Решаю задачу бинарной классификации, тем

не менее не набирается нужный скор.

На вход дают непререрывные и категориальные фичи. Категориальные фичи я перевел в вектора при помощи one hot encoding. Хочу улучшить скор при помощи feature engineering, подскажите пожалуйста будет ли корректно перемножать непрерывные и категориальные фичи между собой, нормализовать и добавить их в датасет?

4 ответов

68 просмотров

Привет, если логическая зависимость есть между непрерывными и категориальными фичами, то да, фича инжиниринг по идее поможет. Но! хорошо бы сделать кросс-валидацию. Ибо можно не улучшить, а даже ухудшить скор. А, ну ещё хорошо бы нормализовать и стандартизировать всю дату перед использованием в модели. Потому что некоторые алгоритмы могут внезапно быть очень чувствительными, и с хорошей нормализацией можно тоже улучшить скор

Kirill-Павлов Автор вопроса
Dan Capybara
Привет, если логическая зависимость есть между неп...

Супер, спасибо. Я же правильно понимаю что если мы логически поперемножали фичи, то нормализовать уже нужно после комибнации фичей между собой, а не до? То есть допустим были ненормализованный фичи f_1, f_2, f_3 и f_1 логически связано с f_3. Тогда мы сначала перемножаем f_1 с f_3, получаем набор фичей f_1, f_2, f_3, f_1f_3 и только после этого нормализуем (тот же z-score normalization)?

Kirill Павлов
Супер, спасибо. Я же правильно понимаю что если мы...

Всё верно, нормализация - после новых комбинированных фич.

Kirill-Павлов Автор вопроса
Dan Capybara
Всё верно, нормализация - после новых комбинирован...

Спааасибо :) Да, вот еще вопрос появился, если не указана суть фичей и они даны в обезличенном виде (просто feature1, feature2, …, featureN), то тут особо feature engineering не применить?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта