рейтинга, например от 1 до 5? Кто-то поставил рейтинг фильму 1 по какому-то параметру, другой человек 4 или 5. В итоге есть вектор рейтингов 1,1,2,5,5. Видно что люди не согласны сильно в отличие например от случая 4,4,4,5,5. Какой метрикой это лучше всего описать?
медиана. в первом случае медиана 2 (хотя среднее почти 3), во втором - 4
Стандартным отклонением? А вообще это сложная тема. Есть специальные методы для восстановления латентной непрерывной переменной, которая как бы скрывается за такими порядковыми шкалами
а принципиально только один показатель? если взять медиану + дисперсию - ширину коридора значений и его местоположение хорошо будет видно
Медиана вряд ли удачно будет показывать рейтинг. Допустим оценка идёт 1,1,5,5,5,5,5. Выходит что медиана 5,а среднее 3.85. Оценка 5 по медиане при таких рейтингах, когда есть две единицы не совсем верно. Здесь должно быть что-то по сложнее.
Согласен, медиана - это мера центральной тенденции, а не разброса
я бы использовал непараметрические статистики в данном случае, поскольку рейтинг - это, скорее, ранги, хотя уже близкие к интервальной шкале. Тем не менее, разница между 2 и 3 — это не разница между 4 и 5, и это хотелось бы учитывать. Например, межквартильный размах (IQR), но он не ухватит различия в выборках, скорее всего, везде IQR будет равен 2. Другой вариант — median absolute deviation https://en.wikipedia.org/wiki/Median_absolute_deviation Вот это бы как раз хорошо могло подойти здесь и поймать различия позволит
Обсуждают сегодня