и после постобработки?
Нет, у каждого случайные 10 с постобработкой, остальные - без, все подобрано так чтобы каждое исследование было хотя бы 1 раз размечено с постобработкой и хотя бы 1 раз без. Целиком парного анализа чтобы исследование было одного и то же, эксперт один и тот же, но 1 раз с, 1 раз без - нет (специфика области, у экспертов слишком хорошая память). Дополнительно есть контрольная группа, в которой другие эксперты размечали те же самые исследования но без какой бы то ни было постобработки.
я бы для начала просто сравнил средние значения времени разметки до и после постобработки
да, конечно, с этого я начал
контроль еще можно использовать, сведя все к сравнению двух средних или медиан (выбросив при этом результаты оценки до постобработки для неконтрольной группы экспертов)
да, тут как раз все нормально, 20% эффект, хорошее pvalue
Обсуждают сегодня