215 похожих чатов

Товарищи, а насколько разумно проводить кластеризацию 500 объектов по 100

признакам?
Необходимо ли предварительно снизить размерность каким-нибудь PCA?

10 ответов

4 просмотра

Предположим после PCA ушло 50% признаков, поменяется ли что-либо в вашем вопросе тогда?

Oleg-Antonovich Автор вопроса
Sergei L
Предположим после PCA ушло 50% признаков, поменяет...

В целом, нет. Может, я неправильно сформулировал вопрос. Я хотел бы узнать: плохо ли ведут себя алгоритмы кластеризации при большой размерности, нужно ли с этим бороться (как, например, нужно избавляться от разной размерности в кластеризации или от мультиколлинеарности в линейной регрессии)

Oleg Antonovich
В целом, нет. Может, я неправильно сформулировал в...

Общий концепт: все обусловлено данными. чего-то плохого в общем смысле нет. Если данные у вас в принципе не образуют кластера, то понятно дело без каких-то предоборботок их получить не удасться (если вообще можно и т.д)

Oleg Antonovich
Спасибо большое

нз (не сказал, но вы должы понимать, что в каком-то смысле теряете информацию в замен на "упрощение". такова цена обработки; т.е. просто так фигачить, что попало - так себе тема без "подумать и проанализировать")

Oleg Antonovich
Спасибо большое

вообще еще есть иерархическая (агломеративная) кластеризация -- если грубо, можно настраивать количество кластеров (типо, не доводить до 1, 2, 3, ... элементов в кластере, если считаешь, что это маленький кластер), не уверен ,что классно объяснил, но погугли)

А какой алгоритм кластеризации ты выбрал?

Oleg-Antonovich Автор вопроса
Max 🍿
А какой алгоритм кластеризации ты выбрал?

В процессе выбора, но не рассматриваю иерархические. Конкретно сейчас остановил взгляд на mean shift

Oleg Antonovich
В целом, нет. Может, я неправильно сформулировал в...

Смотря на чем основан алгоритм кластеризации? Косинусная мера близости?

Oleg Antonovich
В целом, нет. Может, я неправильно сформулировал в...

Почитайте про "проклятие размерности". Грубо говоря, чем больше измерений у пространства, тем сложнее разделить в нём точки на кластеры.

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
7
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Всем привет! вывожу на общей стр дочерние ресурсыв каждом ресурсе галерея, и первая фотка должна выводиться на общей [!DocLister? &prepare=photo !]
Alekso
12
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
7
А можно вопрос? Мне сегодня сказали что у меня функция (которая просто заполняет массив значениями) не правильная void Full(double * arr, int n) { for (int i = 0; i < n; i...
† C E †
7
Добрый вечер. Хочу чтобы у меня в классе поле было функцией, которая возвращает строку. Делаю так: interface ... TGetOutPath = function : String of object; ... protec...
Kirill Filippenok
12
Карта сайта