169 похожих чатов

Всем доброй ночи )) Вопрос, скорее в целях познания, кто чем

или каким методом пользуются для поиска нелинейных зависимостей??

У R , для этих целей, использовую ppsr пакет (predict power score) который вроде как на деревьях построен и для больших массивов (в отл от корреляции) считается или Ооч медленно или вообще в ошибку может выпасть

У питона (сейчас наткнулся) есть phid который (как я понял) примерно+- тоже самое делает (хз что с производительностью у него на больших таблицах)

Иногда помогает Крамер или логорифмирование как говорят

Собственно отсюда и вопрос, кто что у себя в работе использует?

34 ответов

69 просмотров

https://www.r-bloggers.com/2017/07/generalized-additive-models/

Можно построить матрицу диаграмм рассеяния с помощью ggpairs

Михаил-Ad.fesha Автор вопроса
Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

Хмм Это то что используете ? Просто, условно, при EDA, получили на вход табл, создать гам модель , создать лм, сравнить ановой - несколько геморрней, чем вывести табл с Корр и пср

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Если честно я редко использую не линейные модели. Не обязательно делать прят так как тут в блоге написано))

Mr.britva
Если честно я редко использую не линейные модели. ...

Это обычно то, что запускаю если нелинейная модель нужна, да

Михаил-Ad.fesha Автор вопроса
Dm Kb
Можно построить матрицу диаграмм рассеяния с помощ...

Да, так периодически делаю, но порой попадаются табл - 20+ столбцов, для каждой из них построить диаграмму - посмотреть, тож такое себе удовольствие Давайте конкретизирую Сейчас при беглом еда получил на вход табл 50+ столбцов, вывел табл имя столбца х, столбца у, коф Корр и коф пср - отсортировал Возможно, есть более интересные/правильные/сота и ТД методы, которые при моем подходе - не участвует)) Отсюда и вопрос, кто что исп

Не уверен что я правильно понял вопрос… тренирую GBM (xgboost) и смотрю feature importance

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Сравнивать с линейной моделью кстати не обязательно, если вы решили моделировать нелинейную зависимость, то линейная вас по видимому изначально чем то не устроила

Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

GAM же (из коробки), судя по названию, не учитывает кросс-эффекты, или я что-то упускаю?

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Не уверен что я правильно понял вопрос… тренирую...

А если вопрос академический и задача как раз в том, чтобы не учесть взаимодействия

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Не уверен что я правильно понял вопрос… тренирую...

По сути да, это же интерпретируемость, т.е оцифровка значимости (влияния). Это как раз и рассчитывает ppsr (правда там деревья а не градиент)

Михаил Ad.fesha
По сути да, это же интерпретируемость, т.е оцифров...

Деревья - прошлый век, у них же обычно большая variance, лучше лес или гбм. Я вижу это так: если (из-за большой variance) я не могу доверять предсказаниям деревьев для таргет переменной, почему я должен доверять деревьям в плане variance importance. Variance importance имеет смысл использовать если она получена из «хорошей модели» (хорошеть определяется на hold-out

Ілія Малекі
А если вопрос академический и задача как раз в том...

Не узнал вас в мантии… Если на кросс-эффекты пофиг, то тогда не вижу почему бы не ГАМ

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Деревья - прошлый век, у них же обычно большая var...

В точку Я тоже пришел к выводу что если psr на деревьях, то у него наследуются проблемы, например на большом фрейме с зашумленными данными у деревьев скор может спокойно уступать лм

Михаил Ad.fesha
В точку Я тоже пришел к выводу что если psr на дер...

Если вас не интересует значимость в классическом понимании, а достаточно importance можно попробовать boruta

Alexey Ivanov
Не узнал вас в мантии… Если на кросс-эффекты пофи...

Тогда следующая ступень: почему бы и не линейная модель от f(X). Вплоть до radial basis function можно извращаться!

Михаил Ad.fesha
В точку Я тоже пришел к выводу что если psr на дер...

А в этом случае (мол, на деревья засматриваетесь) SHAP на бустинге предлагаю

Ілія Малекі
Тогда следующая ступень: почему бы и не линейная м...

Добавить warped регрессию и горя не знать вообще

Ілія Малекі
А в этом случае (мол, на деревья засматриваетесь) ...

У shap есть недостатки? Вроде долго считается? Ещё что-то?

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Деревья - прошлый век, у них же обычно большая var...

Идеал - не строить модель а вывести список с коэф, что бы понять, на что смотрим в первую очередь, что чуть позже Если с модели брать, то как то в плане логики у меня диссонанс возникает Типа строим модель (хорошую 😈), смотрим важные для нее признаки, возвращаемся к еда и работаем с этими фичами?

Alexey Ivanov
У shap есть недостатки? Вроде долго считается? Ещё...

Я не знаю о недостатках shap, но я и не залазил ему в математику

Михаил-Ad.fesha Автор вопроса
Mr.britva
Если вас не интересует значимость в классическом п...

Кстати. Вот про него слышал, но не изучал и не применял. Самое время думаю )) В моем представлении, это что то из разряда pca было...

Михаил Ad.fesha
Кстати. Вот про него слышал, но не изучал и не при...

Это враппер над случайным лесом, который добавляет случайные фичи и фильтрует реальные фичи с учётом значимости рандомных

Михаил-Ad.fesha Автор вопроса
Mr.britva
Это враппер над случайным лесом, который добавляет...

Типа если у рандомной выше значимость то факт фичу отметать ?

Михаил Ad.fesha
Идеал - не строить модель а вывести список с коэф,...

Да, может получится диссонанс - для того чтобы сделать модель требуется модель. Но я отвечал на вопрос «найти нелинейные зависимости», а для чего это будет дальше использоваться не задумывался: можно более детально изучать в ручном режиме и какие-то выбросить, или построить на них GAM (возможно вручную добавив кросс-эффекты) или просто оставить в анкете только топ-предикторы а остальные выкинуть как несущественные.

1. GAM https://t.me/r_in_action/239 Взаимодействие там есть, читаем книги и лекции. 2. RuleFit https://cran.r-project.org/web/packages/xrf/readme/README.html

Ilya Shutov
1. GAM https://t.me/r_in_action/239 Взаимодействи...

1. Так там все взаимодействия надо вроде как вручную добавлять, при большом количестве предикторов рука устанет все тестить

Сам пока не пробовал, но Макс Кун хвалил https://github.com/mayer79/hstats

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта