215 похожих чатов

Здравствуйте! А кто-то может рассказать какие количества признаков вы используете

в регрессионных моделях? Насколько важно для повышения точности количество признаков ?

24 ответов

13 просмотров

по максу, но исключая коррелированные признаки

⬜️-troglodytes Автор вопроса
Григорий Lᵖ space
по максу, но исключая коррелированные признаки

Я просто только начинаю. И не знаю, сотни признаков это слишком много? Или 100-200 могут быть?

⬜️ troglodytes
Я просто только начинаю. И не знаю, сотни признако...

смотря какая задача на самом деле. 100 наверное нагруженно как то

⬜️-troglodytes Автор вопроса
Григорий Lᵖ space
смотря какая задача на самом деле. 100 наверное на...

Понятно. А как их создавать в таком количестве? Все из головы? Или это уже включая разные преобразования типа poly ?

⬜️ troglodytes
Понятно. А как их создавать в таком количестве? Вс...

не надо создавать ниче. вы получайте вход и прогнозируйте

Григорий Lᵖ space
не надо создавать ниче. вы получайте вход и прогно...

Не, ну определённый фичеинжениринг нужен, но в разумных пределах, конечно

⬜️-troglodytes Автор вопроса
Alexander
а у вас фич оригинальных сколько?

У меня аналитическая задача. Фичи сам создаю . из основных - 3 метрики магазина. Предсказывается 4-ая метрика .

Roman Nm
Не, ну определённый фичеинжениринг нужен, но в раз...

iris и без всяких фич инжинирингов работает прекрасно)

Количество предикторов вероятнее всего полезно чем больше тем лучше, если: распределение нормальное (с количеством столбцов вероятность падает); отсутствует коллинеарность (чем больше, тем меньше вероятность); вовремя распознает выбросы и аккуратно их удаляете. Выводы делайте сами.

⬜️ troglodytes
У меня аналитическая задача. Фичи сам создаю . из ...

я скажу за свой опыт. вся логика которую я заносил в синтетические датасеты в лучшем случае она и находилась.

⬜️-troglodytes Автор вопроса
Sasha M
Попробуйте так модель написать

Сделал но был очень низкий R*2 . добавил фичи связанные с характеристиками магазинов и R*2 стал 0.6 примерно. Но это же все равно мало?

Григорий Lᵖ space
раскажите подробнее пожалуйста

я в пору полной дикости баловался с кластеризацией. делал датасет больных. они у меня имели свои склонности к заболеваниям. кто то к простудам. кто то к давлению. потом я качал историю погоды и по некоторой логике у меня эти люди болели . потом я их кластеризовал. ну как бы да, те кто имели одинаковые склонности те попадали в одни кластеры. что вложил - то и получил

Alexander
я в пору полной дикости баловался с кластеризацией...

просто мне однажды сказали что плодить новую инфу из того что есть не имеет смысла и я поверил

Alexander
я плодил из того чего не было)

а ну ок, тогда концепт правильынй

⬜️ troglodytes
Не очень понял

я выше все описал. создавал датасет, потом искал в нем зависимости. находил ровно то что заложил

Григорий Lᵖ space
просто мне однажды сказали что плодить новую инфу ...

Ну как... Для линрега имеют смысл всякие нелинейные преобразования. А для бустинга - нет :)

Roman Nm
Ну как... Для линрега имеют смысл всякие нелинейны...

согласен с вами. речь шла просто о предположении что комбинация новых фич даст что то новое. тут же упирается в линеность нелинейность.

Roman Nm
Ну вот для линейной модели это новое :)

да ладно. с точки зрения информации нет. но с точки зрения способности к аппроксимации да

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта