Всем доброй ночи )) Вопрос, скорее в целях познания, кто чем

Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

А почему f_1(x_1) а не k_1*f_1(x_1)?

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

Хмм Это то что используете ? Просто, условно, при EDA, получили на вход табл, создать гам модель , создать лм, сравнить ановой - несколько геморрней, чем вывести табл с Корр и пср

0

02.09.2023

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Если честно я редко использую не линейные модели. Не обязательно делать прят так как тут в блоге написано))

0

02.09.2023

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Так вам ещё выбрать функции надо :)

0

02.09.2023

Mr.britva
Если честно я редко использую не линейные модели. ...

Это обычно то, что запускаю если нелинейная модель нужна, да

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Dm Kb
Можно построить матрицу диаграмм рассеяния с помощ...

Да, так периодически делаю, но порой попадаются табл - 20+ столбцов, для каждой из них построить диаграмму - посмотреть, тож такое себе удовольствие Давайте конкретизирую Сейчас при беглом еда получил на вход табл 50+ столбцов, вывел табл имя столбца х, столбца у, коф Корр и коф пср - отсортировал Возможно, есть более интересные/правильные/сота и ТД методы, которые при моем подходе - не участвует)) Отсюда и вопрос, кто что исп

0

02.09.2023

Не уверен что я правильно понял вопрос… тренирую GBM (xgboost) и смотрю feature importance

0

02.09.2023

Михаил Ad.fesha
Хмм Это то что используете ? Просто, условно, пр...

Сравнивать с линейной моделью кстати не обязательно, если вы решили моделировать нелинейную зависимость, то линейная вас по видимому изначально чем то не устроила

0

02.09.2023

Mr.britva
https://www.r-bloggers.com/2017/07/generalized-add...

GAM же (из коробки), судя по названию, не учитывает кросс-эффекты, или я что-то упускаю?

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Mr.britva
Сравнивать с линейной моделью кстати не обязательн...

Но фор улу все равно писать придется))))

0

02.09.2023

Alexey Ivanov
GAM же (из коробки), судя по названию, не учитывае...

На сколько я понимаю - да

0

02.09.2023

Alexey Ivanov
Не уверен что я правильно понял вопрос… тренирую...

А если вопрос академический и задача как раз в том, чтобы не учесть взаимодействия

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Alexey Ivanov
Не уверен что я правильно понял вопрос… тренирую...

По сути да, это же интерпретируемость, т.е оцифровка значимости (влияния). Это как раз и рассчитывает ppsr (правда там деревья а не градиент)

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Ілія Малекі
А если вопрос академический и задача как раз в том...

Интересно получилось бы ))

0

02.09.2023

Михаил Ad.fesha
По сути да, это же интерпретируемость, т.е оцифров...

Деревья - прошлый век, у них же обычно большая variance, лучше лес или гбм. Я вижу это так: если (из-за большой variance) я не могу доверять предсказаниям деревьев для таргет переменной, почему я должен доверять деревьям в плане variance importance. Variance importance имеет смысл использовать если она получена из «хорошей модели» (хорошеть определяется на hold-out

0

02.09.2023

Ілія Малекі
А если вопрос академический и задача как раз в том...

Не узнал вас в мантии… Если на кросс-эффекты пофиг, то тогда не вижу почему бы не ГАМ

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Alexey Ivanov
Деревья - прошлый век, у них же обычно большая var...

В точку Я тоже пришел к выводу что если psr на деревьях, то у него наследуются проблемы, например на большом фрейме с зашумленными данными у деревьев скор может спокойно уступать лм

0

02.09.2023

Михаил Ad.fesha
В точку Я тоже пришел к выводу что если psr на дер...

Если вас не интересует значимость в классическом понимании, а достаточно importance можно попробовать boruta

0

02.09.2023

Alexey Ivanov
Не узнал вас в мантии… Если на кросс-эффекты пофи...

Тогда следующая ступень: почему бы и не линейная модель от f(X). Вплоть до radial basis function можно извращаться!

0

02.09.2023

Михаил Ad.fesha
В точку Я тоже пришел к выводу что если psr на дер...

А в этом случае (мол, на деревья засматриваетесь) SHAP на бустинге предлагаю

0

02.09.2023

Ілія Малекі
Тогда следующая ступень: почему бы и не линейная м...

Добавить warped регрессию и горя не знать вообще

0

02.09.2023

Ілія Малекі
А в этом случае (мол, на деревья засматриваетесь) ...

У shap есть недостатки? Вроде долго считается? Ещё что-то?

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Alexey Ivanov
Деревья - прошлый век, у них же обычно большая var...

Идеал - не строить модель а вывести список с коэф, что бы понять, на что смотрим в первую очередь, что чуть позже Если с модели брать, то как то в плане логики у меня диссонанс возникает Типа строим модель (хорошую 😈), смотрим важные для нее признаки, возвращаемся к еда и работаем с этими фичами?

0

02.09.2023

Alexey Ivanov
У shap есть недостатки? Вроде долго считается? Ещё...

Я не знаю о недостатках shap, но я и не залазил ему в математику

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Mr.britva
Если вас не интересует значимость в классическом п...

Кстати. Вот про него слышал, но не изучал и не применял. Самое время думаю )) В моем представлении, это что то из разряда pca было...

0

02.09.2023

Михаил Ad.fesha
Кстати. Вот про него слышал, но не изучал и не при...

Это враппер над случайным лесом, который добавляет случайные фичи и фильтрует реальные фичи с учётом значимости рандомных

0

02.09.2023

Михаил Ad.fesha Автор вопроса

Mr.britva
Это враппер над случайным лесом, который добавляет...

Типа если у рандомной выше значимость то факт фичу отметать ?

0

02.09.2023

Михаил Ad.fesha
Типа если у рандомной выше значимость то факт фичу...

Ага

0

02.09.2023

Михаил Ad.fesha
Идеал - не строить модель а вывести список с коэф,...

Да, может получится диссонанс - для того чтобы сделать модель требуется модель. Но я отвечал на вопрос «найти нелинейные зависимости», а для чего это будет дальше использоваться не задумывался: можно более детально изучать в ручном режиме и какие-то выбросить, или построить на них GAM (возможно вручную добавив кросс-эффекты) или просто оставить в анкете только топ-предикторы а остальные выкинуть как несущественные.

0

02.09.2023

Ilya Shutov

1. GAM https://t.me/r_in_action/239 Взаимодействие там есть, читаем книги и лекции. 2. RuleFit https://cran.r-project.org/web/packages/xrf/readme/README.html

0

03.09.2023