169 похожих чатов

Подскажите, какой метрикой лучше всего описать разброс в целочисленных значениях

рейтинга, например от 1 до 5? Кто-то поставил рейтинг фильму 1 по какому-то параметру, другой человек 4 или 5. В итоге есть вектор рейтингов 1,1,2,5,5. Видно что люди не согласны сильно в отличие например от случая 4,4,4,5,5. Какой метрикой это лучше всего описать?

6 ответов

9 просмотров

медиана. в первом случае медиана 2 (хотя среднее почти 3), во втором - 4

Стандартным отклонением? А вообще это сложная тема. Есть специальные методы для восстановления латентной непрерывной переменной, которая как бы скрывается за такими порядковыми шкалами

а принципиально только один показатель? если взять медиану + дисперсию - ширину коридора значений и его местоположение хорошо будет видно

Nikita Karlushin
медиана. в первом случае медиана 2 (хотя среднее п...

Медиана вряд ли удачно будет показывать рейтинг. Допустим оценка идёт 1,1,5,5,5,5,5. Выходит что медиана 5,а среднее 3.85. Оценка 5 по медиане при таких рейтингах, когда есть две единицы не совсем верно. Здесь должно быть что-то по сложнее.

A.K. A.K.
Медиана вряд ли удачно будет показывать рейтинг. Д...

Согласен, медиана - это мера центральной тенденции, а не разброса

я бы использовал непараметрические статистики в данном случае, поскольку рейтинг - это, скорее, ранги, хотя уже близкие к интервальной шкале. Тем не менее, разница между 2 и 3 — это не разница между 4 и 5, и это хотелось бы учитывать. Например, межквартильный размах (IQR), но он не ухватит различия в выборках, скорее всего, везде IQR будет равен 2. Другой вариант — median absolute deviation https://en.wikipedia.org/wiki/Median_absolute_deviation Вот это бы как раз хорошо могло подойти здесь и поймать различия позволит

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
Кибер Бомж
8
Карта сайта