них мне лучшие результаты принесет? Мне для дискриминантного анализа нужна normal distribution, по крайней мере так в книге написано. Поэтому хочу посмотреть, какая из методов мне принесет distribution, которая более или менее на нормальную похожа. Или я неправильно мыслю? Я рада очень подсказкам, так как это мой первый проэкт в Data Science и охота хорошую оценку 😁
а как вы поймете, какой вариант хороший? который лучше приблизит к нормальному распределению? так это так себе критерий. я бы брал импутацию медианами, наверное. если честно, я с трудом помню дискриминантный анализ, это где строится уравнение для каждого класса? вообще, по моему скромному опыту, капризный метод. я бы регрессионный анализ взял, он примитивнее и стабильнее. и там не особо нормальность распределения данных нужна, скорее, нужна нормальность распределения остатков.
Обсуждают сегодня