215 похожих чатов

Всем привет! Начинаю изучать ML. Решаю задачу бинарной классификации, тем

не менее не набирается нужный скор.

На вход дают непререрывные и категориальные фичи. Категориальные фичи я перевел в вектора при помощи one hot encoding. Хочу улучшить скор при помощи feature engineering, подскажите пожалуйста будет ли корректно перемножать непрерывные и категориальные фичи между собой, нормализовать и добавить их в датасет?

4 ответов

29 просмотров

Привет, если логическая зависимость есть между непрерывными и категориальными фичами, то да, фича инжиниринг по идее поможет. Но! хорошо бы сделать кросс-валидацию. Ибо можно не улучшить, а даже ухудшить скор. А, ну ещё хорошо бы нормализовать и стандартизировать всю дату перед использованием в модели. Потому что некоторые алгоритмы могут внезапно быть очень чувствительными, и с хорошей нормализацией можно тоже улучшить скор

Kirill-Павлов Автор вопроса
Dan 船長
Привет, если логическая зависимость есть между неп...

Супер, спасибо. Я же правильно понимаю что если мы логически поперемножали фичи, то нормализовать уже нужно после комибнации фичей между собой, а не до? То есть допустим были ненормализованный фичи f_1, f_2, f_3 и f_1 логически связано с f_3. Тогда мы сначала перемножаем f_1 с f_3, получаем набор фичей f_1, f_2, f_3, f_1f_3 и только после этого нормализуем (тот же z-score normalization)?

Kirill Павлов
Супер, спасибо. Я же правильно понимаю что если мы...

Всё верно, нормализация - после новых комбинированных фич.

Kirill-Павлов Автор вопроса
Dan 船長
Всё верно, нормализация - после новых комбинирован...

Спааасибо :) Да, вот еще вопрос появился, если не указана суть фичей и они даны в обезличенном виде (просто feature1, feature2, …, featureN), то тут особо feature engineering не применить?

Похожие вопросы

Обсуждают сегодня

я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
49
читать файл максимально быстро? странный вопрос))
zamtmn
53
How to create an OS in C? what to study?
Linus
18
Всем доброго вечера! Хочу поделиться своим злоключением с человеком, который, как оказалось сюда тоже скидывал свое резюме. Жаль, что я вашу группу не нашел раньше… человек ки...
Роман Ахмедзянов
4
Компания Elif ищет менеджера проектов, который будет заниматься поиском и ведением новых проектов. Прежде чем приступить к работе, вам нужно пройти наш недельный курс, где вы ...
Elif
5
тоесть, указав return eax, сгенерируется никому ненужная инструкция mov eax,eax ?
Aiwan \ (•◡•) / _bot
24
Привет, кто может сделать юзербота с апи? Задачи: - создавать группы - создавать каналы - задавать для созданных каналов аватарку или эмоджи, имя группы - добавлять в группы...
Lencore
11
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
@HemulGM Параметры у AddStream поменялись? Несостыковка какая-то
Катерина Свиридова
12
Добрый день. Созданию отношения таблиц для учёта кораблей, их движения между точками (портами) согласно расписания. Терзают сомнения в правильном ли направлении двигаюсь 😅 1...
Aleksey
1
Карта сайта