но вдруг кто подскажет, я уже во всех чатах спросила, так и не получила конкретный ответ(
А у меня уже дедлайны (
Помогите пожалуйста выбрать регрессию.
У меня зависимые переменные - результаты тестов, значения числовые , от 0 до 5 или от 0 до 40.
Градация имеет логический смысл ( чем больше тем лучше, или наоборот чем меньше тем лучше).
Ненормальное распределение.
Независимые- числовые и категориальные.
Мне подойдет линейная регрессия с будстрепом для таких переменных ?
Вопрос именно про линейную регрессию с будстрепом в спсс, другие методы я не смогу ни применить, ни интерпретировать, ни делегировать.
Всем заранее спасибо!
зависимые перегнать в 3/5 значений, сделать мультиномиальную либо пробит.
Также неясно, почему такая дискреетность зависимой переменной. Range какой? от 0 до 40?
Градация имеет логический смысл ( чем больше тем лучше, или наоборот чем меньше тем лучше). Вот тут ошибка. У Вас шкала часом не в стиле -20/+20?
чтобы зря не тратить время на уточнения, можно прочитать для начала переписку последних трех дней. https://t.me/c/1396811120/9673
Спасибо. Но не увижу уже) Оно для меня забанено. Будем считать, что я пролетел с трендом.
Ну пишет "Нет доступа к сообщению, не участник чата". Видать чат закрытый)
линейная с будстрепом тут точно будет ошибкой, или тоже приемлемо, но не предпочтительно? я просто уже сделала, не хочу переделывать, если это необязательно, мультиноминалтную или пробит придется осваивать и делать ещё несколько дней, хочу отделаться малой кровью ввиду дефицита времени и знаний.
Число наблюдений если более 30, но плохо с распределением — помогает непараметрическая регрессия. В R есть некоторые инструменты, но их надо адаптировать. Например, GAM regression. Но там немало своих приколов с интерпретацией.
Девушка в SPSS работает
Тут надо шкалу сделать дискретной и вперед) Если речь про СПСС. Там не очень много способов для такой задачи, если надо сделать качественно.
Что значит " сделать шкалу дискретной" ?
Разбить шкалу зависимой переменной на равные интервалы. Задействовать регрессию, где будет хорошой зависимой переменной с интервалами.
Я думаю, что в вашем случае, если время поджимает, есть два пути: либо попытаться все-таки разобраться, как в спсс применять sandwich variance estimators, ссылки вам кидали. Либо забить и остановиться на бутстрепе.
Ну я конечно склоняюсь ко второму варианту, просто если он заведомо ошибочный, то придётся от него отказаться. Мне пока никто так и не ответил в чатах, линейная с будстрепом это ошибка и точно неправильный способ для меня, или он всё-таки приемлемый.
Максим же писал, что бутстреп в принципе тоже должен подойти
Я думаю, что его не уверен - это значит, что это не заведомо ошибочный вариант :)
никто не может ответить потому что 1) вы не формулируете четко задачу, 2) у вас нет времени/желания/возможности изучить теоретический материал по статистике, 3) вы меряете все категориями правильно или неправильно (а должно быть: подходит данный анализ под задачу или нет)
Если что, вот ссылка https://t.me/+pMRHT68oITFhNmYy После вступления в чат ссылки на сообщения будут работать
Ну и потому что к одной задаче может быть несколько разных подходов, каждый со своими плюсами, минусами и подводными камнями.
из того, что стало известно о вашей задаче, есть разные способы решения, которые предлагались в чате биостатера (с разными преимуществами и недостатками) вопрос лишь в ваших теоретических знаниях, навыках и желании
да, я о том же)
Так под задачу подходит несколько разных вариантов, как я понимаю, я пытаюсь выбрать тот, который смогу сделать и описать. И который точно не будет ошибочным. Сделать и описать я могу линейный с будстрепом, другие - нет. Если этот метод подходит, то здорово, но вдруг он в данном случае не приемлемый. Я так несколько недель на деревья потратила, а потом выяснилось, что мне они точно не подходят, и их выводы бессмысленные, и надо всё-таки делать регрессию.
ну сейчас я уже сузила свой вопрос до линейной регрессии с будстреп. Потому что другие сложные и хорошие способы мне не по силам.
деревья вам не подходят исходя из вашей задачи (которую вы сформулировали) вопрос ошибочности метода - это подходит ли он под задачу и с насколько «точным» анализом вы готовы смириться вы хотите услышать точный ответ, но такого нет как уже написали выше, под одну задачу подходит несколько методов так же у каждого здесь есть свой взгляд на то, как и какой проводить статистический анализ (с учетом своих знаний и предпочтений в нюансах)
так вам Максим и ответил в чате медстатистики
я у него уточнила, он не уверен (
математика - неточная наука
вам предлагают варианты, окончательный выбор и решения за вами
Ну вот я почитал про бутстреп для линейных моделей, там есть свои тонкости, но в принципе я не вижу проблем, почему нет. И да, с гетероскедастичностью он должен помочь
Я просто про ваш метод с сэнвичем спрашивала у чатгпт, как его провести в спсс, оказалось, что никак*, но его можно заменить на будстреп. Я попробовала, и выводы получились в принципе адекватные. Но я не очень доверяю чатгпт, а конкретно этот метод мне никто и не рекомендовал из статистиков. Поэтому сегодня вот пытаюсь у всех выяснить, могу ли остановиться уже хотя бы на нем. А то у меня теперь птср после деревьев, которые в итоге не подошли( * да, там был туториал с кучей настроек и условий, но я ни слова не поняла из него, я такой не смогу провести
Ну выдохните и остановитесь на бутстрепе.
ахахаха) спасибо! а то я уже на грани отчаяния с этим анализом (
Обсуждают сегодня