169 похожих чатов

А если не секрет, зачем матрица такого размера нужна? С

ней же ничего сделать нельзя.

Я просто почему спрашиваю, есть например такой метод кластеризации, названия k-means. Там вообще то надо просто промаркировать точки (присвоить каждый номер её кластера), так там почему-то излюбленный метод вычисления это как раз через вычисление матрицы попарных расстояний.

Но так как, нужны то только лейблы, вычисления матрицы можно пропустить. Мы это сделали и у нас получилось ускорение раз в 50.

2 ответов

9 просмотров

Я как студент-физик со свободным временем делаю "черновую работу", а результаты уходят математикам. Это работы по реконструкции многомерного филогенетического облака гена Silva-16s рибосомальной РНК, дивергировавшего от единственного предка. Математики делают свою математику и получают срезы этого многомерного облака, хотя сейчас достоверно даже не известна размерность пространства, в котором это облако находится. Для части алгоритмов, действительно, достаточно 50-100 ближайших соседей каждой точки, но для некоторых (в частности, для поиска симплекса – т.е. набора точек, равноудалённых друг от друга – наименьшей достаточной размерности) кластеризация не подходит и требуется вся матрица целиком.

Alex
Я как студент-физик со свободным временем делаю "ч...

Есть алгоритм local minhash, который в таких задачах используется. Сильно редуцирует расчеты. Зачем считать расстояние в росте между слоном и муравьев, если они навскидку в разные группы входят. Зайца и волка надо — они близки. Была у меня похожая задачка по сравнению email-ов. 3.5 М на 3.5М. Так от бесконечности время расчета упало минут до 10 (алгоритм делал руками). На R, но либы по расчету расстояний нижние сишные, многопоточные.

Похожие вопросы

Обсуждают сегодня

Сообщение* в закодированном виде. То есть, просто сделать sendMessage?text=Привет бла-бла! не получится, надо в HEX переводить, и добавлять процент, типа такого: sendMessage?t...
КТ315
21
А случайно нет ли в паскале штатной возможности передать указатель и количество туда где array of в качестве аргумента?
zamtmn
25
Anyone here suffers from unexplained aural migraines, who would be up for talking for a bit? Doesn't *have* to be aural, but I am not asking about headaches, I mean actual mi...
Martin Rys
58
Всем привет. Испытываю проблемы в работе БД, а именно огромного роста логов, такого характера: 024-05-16 18:39:07 +05 sentry sentry [unknown] 1050169 7-1 app-sentry01.corp.ru>...
Alexey
2
Если подытожить: По мнению Розыча и Хемуля и др. - предпочтительно по возможности объявлять в секции имплементации потому-что: 1) Выше скорость компиляции 2) Не замусоривается...
notme
7
Хм. А телеграм апи работают через HTTP?
The Bird of Hermes
14
Ну раз я пока тут, задам пару глупых вопросов. Зачем писать на ассемблере если компилятор довольно умный, а ассемблер много времени занимает? В каких прикладных задачах сейчас...
Максим Рябцев
20
Почему Telegram пишет, что объект media не найден, хотя на самом деле я его передаю? Делаю на urllib, без зависимостей, так надо. Вызываю метод sendMediaGroup с таким JSON: ...
Alexey S
1
В дельфе нет никакого коробочного (без установки третьих либ) способа получить CallStack с расшифровкой отладочных символов?
notme
7
Приветики всем!)) Подскажите: есть функция, которая записывает число типа Cardinal в четыре байта, хранимые в TBytes. Можете помочь мне, показав, как должна выглядеть функци...
Моринаро
5
Карта сайта