Для каждой пары фильм-тег у меня есть несколько рейтингов (оценка связи тега с фильмом) от разных пользователей. Рейтинг принимает значения: 1 (слабо), 2, 3, 4, 5 (сильно). Я посчитал средний рейтинг для каждой пары, а затем абсолютную разницу между средним и каждым отдельным рейтингом. Назвал абсолютную разницу – ошибкой. Теги разделены на 4 категории: объективные (например, машина), субъективные (красивый), жанры (комедия) и другие (аутентичность). Моя цель – узнать, делают ли пользователи больше ошибок, когда рейтят теги из одной или другой категории, и если это так, то с чем это может быть связано.
Зачем вам эта разница?
Пользователи часто расходятся в мнении насколько сильно тег относится к фильму. Я хочу узнать, зависит ли то, насколько сильно пользователи в среднем расходятся во мнении от категории тега. Например, можно предположить, что пользователи чаще будут согласны друг с другом по поводу объективных тегов, чем субъективных, потому что объективные указывают на факты, которые одни для всех, а субъективные о мнении, которое может у всех быть разным. Однако, я заметил, что разница не такая существенная и хочу проверить это статистически.
Ваша задача заключается в сравнении дисперсии
А можете рассказать более подробно, дисперсии чего?
Дисперсии баллов, выставляемых определённому тегу
Но у меня баллы для пар фильм-тег
Обсуждают сегодня