169 похожих чатов

Всем доброй ночи )) Вопрос, скорее в целях познания, кто чем

или каким методом пользуются для поиска нелинейных зависимостей??

У R , для этих целей, использовую ppsr пакет (predict power score) который вроде как на деревьях построен и для больших массивов (в отл от корреляции) считается или Ооч медленно или вообще в ошибку может выпасть

У питона (сейчас наткнулся) есть phid который (как я понял) примерно+- тоже самое делает (хз что с производительностью у него на больших таблицах)

Иногда помогает Крамер или логорифмирование как говорят

Собственно отсюда и вопрос, кто что у себя в работе использует?

34 ответов

21 просмотр

https://www.r-bloggers.com/2017/07/generalized-additive-models/

Можно построить матрицу диаграмм рассеяния с помощью ggpairs

Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

А почему f_1(x_1) а не k_1*f_1(x_1)?

Михаил-Ad.fesha Автор вопроса
Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

Хмм Это то что используете ? Просто, условно, при EDA, получили на вход табл, создать гам модель , создать лм, сравнить ановой - несколько геморрней, чем вывести табл с Корр и пср

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Если честно я редко использую не линейные модели. Не обязательно делать прят так как тут в блоге написано))

Mr.britva
Если честно я редко использую не линейные модели. ...

Это обычно то, что запускаю если нелинейная модель нужна, да

Михаил-Ad.fesha Автор вопроса
Dm Kb
Можно построить матрицу диаграмм рассеяния с помощ...

Да, так периодически делаю, но порой попадаются табл - 20+ столбцов, для каждой из них построить диаграмму - посмотреть, тож такое себе удовольствие Давайте конкретизирую Сейчас при беглом еда получил на вход табл 50+ столбцов, вывел табл имя столбца х, столбца у, коф Корр и коф пср - отсортировал Возможно, есть более интересные/правильные/сота и ТД методы, которые при моем подходе - не участвует)) Отсюда и вопрос, кто что исп

Не уверен что я правильно понял вопрос… тренирую GBM (xgboost) и смотрю feature importance

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Сравнивать с линейной моделью кстати не обязательно, если вы решили моделировать нелинейную зависимость, то линейная вас по видимому изначально чем то не устроила

Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

GAM же (из коробки), судя по названию, не учитывает кросс-эффекты, или я что-то упускаю?

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Не уверен что я правильно понял вопрос… тренирую...

А если вопрос академический и задача как раз в том, чтобы не учесть взаимодействия

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Не уверен что я правильно понял вопрос… тренирую...

По сути да, это же интерпретируемость, т.е оцифровка значимости (влияния). Это как раз и рассчитывает ppsr (правда там деревья а не градиент)

Михаил-Ad.fesha Автор вопроса
Михаил Ad.fesha
По сути да, это же интерпретируемость, т.е оцифров...

Деревья - прошлый век, у них же обычно большая variance, лучше лес или гбм. Я вижу это так: если (из-за большой variance) я не могу доверять предсказаниям деревьев для таргет переменной, почему я должен доверять деревьям в плане variance importance. Variance importance имеет смысл использовать если она получена из «хорошей модели» (хорошеть определяется на hold-out

Ілія Малекі
А если вопрос академический и задача как раз в том...

Не узнал вас в мантии… Если на кросс-эффекты пофиг, то тогда не вижу почему бы не ГАМ

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Деревья - прошлый век, у них же обычно большая var...

В точку Я тоже пришел к выводу что если psr на деревьях, то у него наследуются проблемы, например на большом фрейме с зашумленными данными у деревьев скор может спокойно уступать лм

Михаил Ad.fesha
В точку Я тоже пришел к выводу что если psr на дер...

Если вас не интересует значимость в классическом понимании, а достаточно importance можно попробовать boruta

Alexey Ivanov
Не узнал вас в мантии… Если на кросс-эффекты пофи...

Тогда следующая ступень: почему бы и не линейная модель от f(X). Вплоть до radial basis function можно извращаться!

Михаил Ad.fesha
В точку Я тоже пришел к выводу что если psr на дер...

А в этом случае (мол, на деревья засматриваетесь) SHAP на бустинге предлагаю

Ілія Малекі
Тогда следующая ступень: почему бы и не линейная м...

Добавить warped регрессию и горя не знать вообще

Ілія Малекі
А в этом случае (мол, на деревья засматриваетесь) ...

У shap есть недостатки? Вроде долго считается? Ещё что-то?

Михаил-Ad.fesha Автор вопроса
Alexey Ivanov
Деревья - прошлый век, у них же обычно большая var...

Идеал - не строить модель а вывести список с коэф, что бы понять, на что смотрим в первую очередь, что чуть позже Если с модели брать, то как то в плане логики у меня диссонанс возникает Типа строим модель (хорошую 😈), смотрим важные для нее признаки, возвращаемся к еда и работаем с этими фичами?

Alexey Ivanov
У shap есть недостатки? Вроде долго считается? Ещё...

Я не знаю о недостатках shap, но я и не залазил ему в математику

Михаил-Ad.fesha Автор вопроса
Mr.britva
Если вас не интересует значимость в классическом п...

Кстати. Вот про него слышал, но не изучал и не применял. Самое время думаю )) В моем представлении, это что то из разряда pca было...

Михаил Ad.fesha
Кстати. Вот про него слышал, но не изучал и не при...

Это враппер над случайным лесом, который добавляет случайные фичи и фильтрует реальные фичи с учётом значимости рандомных

Михаил-Ad.fesha Автор вопроса
Mr.britva
Это враппер над случайным лесом, который добавляет...

Типа если у рандомной выше значимость то факт фичу отметать ?

Михаил Ad.fesha
Идеал - не строить модель а вывести список с коэф,...

Да, может получится диссонанс - для того чтобы сделать модель требуется модель. Но я отвечал на вопрос «найти нелинейные зависимости», а для чего это будет дальше использоваться не задумывался: можно более детально изучать в ручном режиме и какие-то выбросить, или построить на них GAM (возможно вручную добавив кросс-эффекты) или просто оставить в анкете только топ-предикторы а остальные выкинуть как несущественные.

1. GAM https://t.me/r_in_action/239 Взаимодействие там есть, читаем книги и лекции. 2. RuleFit https://cran.r-project.org/web/packages/xrf/readme/README.html

Ilya Shutov
1. GAM https://t.me/r_in_action/239 Взаимодействи...

1. Так там все взаимодействия надо вроде как вручную добавлять, при большом количестве предикторов рука устанет все тестить

Сам пока не пробовал, но Макс Кун хвалил https://github.com/mayer79/hstats

Похожие вопросы

Обсуждают сегодня

а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
Добрый день. Хочу сделать отрисовку по команде на панели. Почему-то рисуется только при втором вызове. С чем может быть связано, не подскажете? procedure TForm1.FormDblClick(...
Kirill Filippenok
20
I just installed it but how do I use it?
Talula
12
Всем доброго дня! Подскажите может кто использовал связку Pagebuilder + Clientsetting. Сами параметры с типом pagebuilder в модуле Clientsetting работают нормально, можно такж...
Александр Добриков
12
Всем привет! Нужен совет от опытных. Переношу свой проект с Делфи 10.2 Токио на Лазарус 3.2 установленный через инсталлятор fpcupdeluxe-x86_64-win64. При импортировании проект...
Дмитрий Завгородний
7
А почему в си некоторые вещи работают с двойными кавычками некоторые с одинарными? Нельзя было все сделать с одними или чтоб работало с разными? например чтоб выводить строки ...
.
15
Всем привет! Подскажите. Я написал приложение на Delphi 10.2 Tokyo под Windows 10. И передо мной стал вопрос о том чтобы сделать это приложение кроссплатформенным (под Linux и...
Дмитрий Завгородний
24
Эх кто-то пришел и весь праздник испортил :( You need complex FBX scene importing setup to change things on import? good luck with that. You need navigation and pathfinding? g...
Serg Gini
5
Good afternoon, I just started learning php in conjunction with mysql. I am registering a system on a local Mamp server using phpMyAdmin. It seems to be stored normally in the...
ManGo
1
я не про это. какая еще есть инфа, или может появиться, что ее можно обозначить названием данной игры? зачем плодить хештеги, которые обозначают одну сущность? в данном случ...
Aiwan \ (•◡•) / _bot
5
Карта сайта