события (0.5% положительных исходов). Я обучил классификатор с помощью cross entropy loss, но accuracy у него получается как у 99.5% - все вероятности, которые он предсказывает, меньше 50%, поэтому все предсказания - 0 (нет события), отсюда тривиальное значение accuracy, которое не зависит от модели. Я всегда ориентировался за значение logloss, но (мое мнение) оно не является объяснимой метрикой. Что посоветуете использовать в качестве объяснимой метрики тут? ROC-AUC, что-то еще? Интересно с обоснованием (или с ссылкой с обоснованием).
К тому же, у меня все время появляются новые данные, и в зависимости от того, как звезды сложатся, априорная вероятность положительного исхода в них меняется в пределах 0.2%-1.5%. Если считать, что две модели одинаково хороши - то какая метрика будет приблизительно одинаковой для них, если у одной модели данные были 0.2%, а у другой - 1.5%?
Я надеюсь, что я внятно изложил мысль, если нет - могу уточнить какие-то моменты.
edit: меня устраивает, что все предсказания - 0, потому что в первую очередь важно, чтобы вероятность соответствовала истине.
F1 попробуй посмотреть
ROC AUC для таких случаев использовать супер адекватно.
А она обладает свойством из второго абзаца? Что roc auc будет одинаковым вне зависимости от того, какая априорная вероятность?
Я правильно понимаю, что тебе нужна вероятность 0?
Нет, мне нужна вероятность 1
Ну так и почему тебя устраивмет модель, замечающая только 0? Которая выдаёт вероятность 1 очень маленькой
Да, обладает. По сути, ROC AUC измеряет вероятность того, что для наблюдения, равновероятно выбранного из всех "единичек", модель предскажет скор выше, чем для наблюдения, равновероятно выбранного из всех "ноликов". Сколько именно единичек или ноликов в штуках - не важно.
Потому что у меня идет несколько параллельных предсказаний, мне нужно отранжировать, какое из них более вероятное
Нет, задача ранжирования событий. Модель одна
Оооооооо, это то, что надо! Если это так, то это прям 100% то, что надо. А есть где-то объяснялка, почему это так?
Сейчас объясню) ROC-кривая рисуется так: проходимся циклом по всем возможным порогам, и для каждого порога на оси Х откладывем долю нулей, у которых скор выше этого порога, а на оси У - долю единиц, у которых скор выше этого порога.
Обсуждают сегодня