Рейтинг- это же порядковые данные? Вот, попадалось мне случайно. Посмотрите, может что-то подскажет. https://youtu.be/1-ADJNE1WNc&t=35m20s
Вот, например, сложный подход - http://doingbayesiandataanalysis.blogspot.com/2017/12/which-movie-is-rated-better-dont-treat.html А народный понятный метод - взять в качестве метрики долю людей, оценивших на две максимальные оценки (Top2-boxes), а в качестве разброса Top2 - Bottom2 Но порог в любом случае определять придется.
Я кстати так и не понял в статье , почему плохо интепретировать как metirc? Потому что распределение напоминает биномиальное ?
Потому что субъективная разница между разными баллами может (сильно) не совпадать. Поэтому не очень корректно, например, сказать, что разница в два балла больше в два раза чем разница в один балл
Это да. Но это вопрос к самому методу сбора. Кажется что никаким инжинирнгом над данными мы проблему метода сбора данных не решаем
Обсуждают сегодня