Похожие чаты

Ещё на сколько вообще адекватной бывает кластеризация по симилярити

фингерпринтов?

18 ответов

36 просмотров

Мы так делали для похожей задачи

А какой алгоритм кластеризации брали? Я в итоге пришел к DBSCAN/OPTICS

смотря для чего - для целей предсказать таргеты - кластеризовать как раз по таргетам - самое оно

Alexander C
смотря для чего - для целей предсказать таргеты - ...

А как это поможет? Ну то есть как отнести неизвестное соединение к кластеру по таргетам?

Danila Iakovlev
А как это поможет? Ну то есть как отнести неизвест...

у нас в трейне и тесте соединения одинаковы

Antonina- Автор вопроса
Danila Iakovlev
А какой алгоритм кластеризации брали? Я в итоге пр...

такая цепочка: по Simplified molecular-input line-entry system (SMILES) посчитаны circular fingerprints, расстояния - посчитаны по Tanimoto similarity. То есть кластеры отображают схожесть химической структуры получается. @Alexander_V_C таргеты вроде не участвуют же, или ты про другой способ?

Alexander C
у нас в трейне и тесте соединения одинаковы

Так а результаты на чем проверяют? Я чет запутался, первый компетишен все-таки)

Antonina
такая цепочка: по Simplified molecular-input line-...

Это да, мне было интересно, как метки кластеров получались из матрицы расстояний, а потом понял, что у вас немного по-другому устроено, я имел в виду вот такое

Antonina
такая цепочка: по Simplified molecular-input line-...

Таргеты можно подключить, если никто не возьмется, я попробую ближе к выходным проаннотировать соединения – изначально думал, что задача сложнее, а тут оказывается у всех молекул даже названия есть, то есть они как минимум в литературе описаны

Antonina
такая цепочка: по Simplified molecular-input line-...

а сорри, я думал ты по таргетам , а что за Танимото симилярити - это ты взяла из того паблик ноутбука ?

смотри - у нас две фичи - клеточный тип, драг, по отдельности все представлено в трейне и в тесте вопрос в комбинациях - в трейне - одни комбинации (то есть пары тип+драг), а в тесте другие ) , понятно ? или не очень ?

Alexander C
а сорри, я думал ты по таргетам , а что за Танимот...

Для вычисления симилярити используют битовый вектор фиксированной длины – фингерпринт, в котором единицы соответствуют наличию той или иной подструктуре, соответственно, чем меньше расстояние между фингерпринтами, тем выше симилярити

Alexander C
смотри - у нас две фичи - клеточный тип, драг, по ...

Понятно, то есть новых соединений не появится?

Danila Iakovlev
Для вычисления симилярити используют битовый векто...

а о каких структурах идет речь ? это специфино для смайлс ?

Danila Iakovlev
Таргеты можно подключить, если никто не возьмется,...

по таргетам я как-то по быстрому кластеризовал тут вот https://www.kaggle.com/code/alexandervc/op2-eda-baseline-s?scriptVersionId=143396607&cellId=19

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
any reference of this implementation?
BitBuddha
29
Ⓐrtto, [4/23/24 7:02 PM] Please explain more fully how it is not working exactly, and what are the steps you are taking, and what error messages come or what happens. Ⓐrtto, ...
Ezza Kezza
2
sounds like people have lost their kaspa on tradeogre... does this mean tradeogre not trustworthy?
Ezza Kezza
15
Страшнейшая правда про списки ЦБ. С первых дней жизни P2P сферы, молодые человеки, начитавшись законодательной базы и "внутренних" документов, решили, что им противостоит сер...
Foxcool
3
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
So much speculation in the last week. So much volatility in price. This is because Hedera has a GC that isn't using the network it's governing. Why aren't people asking why a...
Summit Seeker R
8
Anyone else having this error when trying to make transactions?
Datzel
11
Question: How viable is it to use Anvil as the backend infrastructure for managing a TradFi portfolio, while integrating Flexa for instant liquidity and payment solutions? Cou...
Kevin
2
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Карта сайта