Никто не знает быстрого решения на питоне для кластеризации коротких

CD-hit не подходит ? https://www.kaggle.com/code/alexandervc/cd-hit-sequence-clustering в принципе можно вычислить дистансы, из них граф сделать, граф кластеризовать Лейденом https://www.kaggle.com/code/alexandervc/cafa5-23-groups-and-folds-diamond-igraph но тогда нужен типа даймонда тул - быстро находить сколько-то близких сиквенсов PS ну или может в этом списке что-то есть https://en.wikipedia.org/wiki/Sequence_clustering

Похожие чаты

Никто не знает быстрого решения на питоне для кластеризации коротких

4 ответов

Похожие вопросы