кластеризовать ~3к небольших белков из одного кегг ортолога по сходству (99%). Я никогда не кластеризовал белки, в целом не думаю, что задача сильно отличается от кластеризации нк, но может быть есть какие-то подводные камни. Какой тул посоветуете? UCLUST подойдёт?
Предложенный выше CD-HIT вообще как раз для белков
@ok55991 @olegkovale @marinegor
визуальный контроль и тут полезен и если белков мало - sns.clustermap полезен - это как бы НЕ ДО кластеризация - но в этом и прелесть что можно оценить насколько вообще оно кластризуется
Вам по последовательностям или структурам?
Там есть отдельная тулза для НК, но изначально он для белков сделан Я только что про него узнал и гуглил, если что, я не спец))
По последовательностям
Из подводных только большее количество матриц для выравнивания
А, понятно, спасибо) я думаю что его и использую, сейчас посмотрел вроде то, что надр
Это то да, только не хочется питона расчехлять ради такой задачи)
Обсуждают сегодня