Похожие чаты

Ещё на сколько вообще адекватной бывает кластеризация по симилярити

фингерпринтов?

18 ответов

14 просмотров

Мы так делали для похожей задачи

А какой алгоритм кластеризации брали? Я в итоге пришел к DBSCAN/OPTICS

смотря для чего - для целей предсказать таргеты - кластеризовать как раз по таргетам - самое оно

Alexander C
смотря для чего - для целей предсказать таргеты - ...

А как это поможет? Ну то есть как отнести неизвестное соединение к кластеру по таргетам?

Danila Iakovlev
А как это поможет? Ну то есть как отнести неизвест...

у нас в трейне и тесте соединения одинаковы

Antonina- Автор вопроса
Danila Iakovlev
А какой алгоритм кластеризации брали? Я в итоге пр...

такая цепочка: по Simplified molecular-input line-entry system (SMILES) посчитаны circular fingerprints, расстояния - посчитаны по Tanimoto similarity. То есть кластеры отображают схожесть химической структуры получается. @Alexander_V_C таргеты вроде не участвуют же, или ты про другой способ?

Alexander C
у нас в трейне и тесте соединения одинаковы

Так а результаты на чем проверяют? Я чет запутался, первый компетишен все-таки)

Antonina
такая цепочка: по Simplified molecular-input line-...

Это да, мне было интересно, как метки кластеров получались из матрицы расстояний, а потом понял, что у вас немного по-другому устроено, я имел в виду вот такое

Antonina
такая цепочка: по Simplified molecular-input line-...

Таргеты можно подключить, если никто не возьмется, я попробую ближе к выходным проаннотировать соединения – изначально думал, что задача сложнее, а тут оказывается у всех молекул даже названия есть, то есть они как минимум в литературе описаны

Antonina
такая цепочка: по Simplified molecular-input line-...

а сорри, я думал ты по таргетам , а что за Танимото симилярити - это ты взяла из того паблик ноутбука ?

смотри - у нас две фичи - клеточный тип, драг, по отдельности все представлено в трейне и в тесте вопрос в комбинациях - в трейне - одни комбинации (то есть пары тип+драг), а в тесте другие ) , понятно ? или не очень ?

Alexander C
а сорри, я думал ты по таргетам , а что за Танимот...

Для вычисления симилярити используют битовый вектор фиксированной длины – фингерпринт, в котором единицы соответствуют наличию той или иной подструктуре, соответственно, чем меньше расстояние между фингерпринтами, тем выше симилярити

Alexander C
смотри - у нас две фичи - клеточный тип, драг, по ...

Понятно, то есть новых соединений не появится?

Danila Iakovlev
Для вычисления симилярити используют битовый векто...

а о каких структурах идет речь ? это специфино для смайлс ?

Danila Iakovlev
Таргеты можно подключить, если никто не возьмется,...

по таргетам я как-то по быстрому кластеризовал тут вот https://www.kaggle.com/code/alexandervc/op2-eda-baseline-s?scriptVersionId=143396607&cellId=19

Antonina- Автор вопроса

Похожие вопросы

Обсуждают сегодня

А кто-то пробовал, уезжая из Эстонии получить э-рез и продолжить вести предпринимательскую деятельность внутри Эстонии, используя свой OÜ?
Lalalashechki Lalala
57
@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
I arrived here after a Chico Crypto show highlighted the project & the Team - the fact that the Team had a long history of successfully working with household names gave me e...
Banter is Bullish
5
Dear super pioneers 🥳🥳: I want to purchase a hosting plan for a website where video games, metaverse, AI avatars, videos, and heavy virtual twins can be uploaded, which I wan...
Guapi
10
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
10
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
Карта сайта