чел
Тестовые нормы это перевод сырых баллов в стандартные на основе нормативной выборки. Если тестовых норм нет, из при достаточном объеме выборки получают самостоятельно
Я бы попробовал посчитать по шкалам z-оценки и засунуть их в модель. Z = (сырой балл - среднее сырого балла)/стандрт. Откл. Сырого балла
У нас распределение не нормальное.
Это не так страшно, как кажется
Можно сделать так называемую форсированную нормализацию, если так критично что распределение отклоняется от нормального
И я бы попробовал деревья решений вместо логистической, например, с помощью пакета FFTrees
Также не брал вместе все 32 шкалы: либо только шкалы или только субшкалы
А не ломает это все принципы статистики? Всегда это интересовало, потому что в моем понимании после «приведения к нормальному распределению» это больше не статистика, а игры в цифры. Так как предположение для многих законов что «распределение нормальное». А так выглядит натягиванием совы на глобус. Или я ошибаюсь?
отклонение распределения тестовых баллов от нормального в классической психометрике является следствием несовершенства тестовой процедуры (подбора тестовых заданий), поэтому очень часто используют форсированную нормализацию
никакого греха тут нет, это просто нормальный обратный интеграл от процентильного балла (кумулятивной вероятности), что в итоге будет давать распределение близкое (похожее) к нормальному, да это подгонка под нормальную модель, но обсуждение выходит за рамки тематики чата
представьте себе, что я вычислила з-скоры, вставила их в уравнение вместо сырых и получилось намного лучше! Я уж не знаю как Вас благодарить! :)
опыт не пропить :)
"Людского во мне до*много*. Смотрю, статистик сидит, распределения свои др*считает*. Я говорю ему "старина, сье*позволь помогу*. Пускаю XGboost для классификации по датасету, в тот же вечер гиперпараметры настроили" (с)
;) Откуда цитата?
Это мем такой, ироничный парень Паша Техник демонстрировал, как не нужно помогать людям, и это стало символом медвежьей услуги
Обсуждают сегодня