а в чем исходная биологическая задача?
Почему метрика странная? Биологическая задача, если коротко, DEG по кластерам разбить. В результате мягкой кластеризации мы не получаем просто для каждого гена принадлежность к кластеру, а для каждого гена вероятность его принадлежности к кластеру. Таким образом, какой порог выбрать, чтобы это было правильно с какой-то точки зрения (а вот и хз с какой точки зрения! Не могу загуглить!) Я пока не придумал ничего лучше, чем поступить похожим образом, как с определением параметров для DBSCAN: взять все вообще числа, которые у меня получаются (все вероятности отнесены к кластерам), отсортировать, нарисовать скеттерплот и взять тот порог по принадлежности, где изгиб (метод локтя или как оно?)
Обсуждают сегодня