лаборатория, которая выполняет некое "скрининговое" исследование, и на основании его результатов принимает решение о выполнении (или невыполнении) расширенного, подтверждающего исследования.
К сожалению, методика выполнения исследования не стандартизирована, и пороговые значения, при которых лаборатория должна выполнять расщиренное исследование не определены. задачу определения этих границ решали следующим образом:
1. провели полное исследование (скрининг и расширенное) более 1000 образцов из популяции (то есть все присланные в лабораторию за период исследования)
2. По результатам работы лаборатории, каждому исследованию был присвоен статус "нормальная проба" или "патологичная проба"
3. Построена логистическая регрессия, в качестве предикторов - количественные результаты скринингового исследования, зависима переменная - класс (норма/патология)
4. Определена точка cut-off (по максимуму accurancy)
Собственно вопрос. А как можно уточнять и "дообучать" алгоритм в будущем? То есть, для проб признанных текущим классификатором как нормальные - подтверждения не будет. Подтверждающие исследования будут проведены только для проб, признанных патологичными первоначальным классификатором. То есть получать в итоге мы будем данные только по TP и FP результатам, а подтверждения TN или выявления FN не будет. Пните, пожалуйста, в какую сторону почитать?
Это в принципе так не делается, начиная со сбора данных и максимизации accuracy
Обсуждают сегодня