215 похожих чатов

Добрый день! Не могли бы Вы пояснить для тупых, почему не

изобретен способ расчета explained_variance для TSNE по аналогии с PCA? И как правильно подобрать число измерений в урезанном пространстве для TSNE, чтобы сокращенное число предикторов в достаточной степени описывало изначальные данные?)

Буду благодарен!

6 ответов

9 просмотров

https://stats.stackexchange.com/questions/340175/why-is-t-sne-not-used-as-a-dimensionality-reduction-technique-for-clustering-or

Igor-Danilov Автор вопроса

Нет, мне для кластеризации... Просто я не уверен, что tsne сохраняет исходные закономерности в данных. Спасибо, буду читать. 👍

Igor-Danilov Автор вопроса

Я понимаю под закономерностями информацию, содержащуюся в предикторах, и которая может быть полезна при выделении кластеров. В случае PCA я мирюсь, с тем что использую только (к примеру) 90% explained variance и строю дальше кластеры на основе этой информации. В случае tSNE я был немного удивлен тем, какое радикальное сокращение параметров может быть произведено и поэтому задал этот вопрос. Кстати, @ianpile тут: https://stats.stackexchange.com/questions/340175/why-is-t-sne-not-used-as-a-dimensionality-reduction-technique-for-clustering-or я так и не нашел ответа на свой вопрос. Зато я понял, что tSNE нельзя применить к новым данным и поэтому он не используется для обучения с учителем. Хотя, на мой взгляд, можно попробовать натренировать сетку на получающееся отображение, чтобы потом применять tSNE к новым данным тоже. Спасибо Andrey, теперь я понял что проблема в том, что снижение размерности нелинейное и каждый раз (при новом запуске, на новых данных) нелинейное по-разному. Нет готовой методики расчета дисперсии. Хотя, быть может, можно было бы изобрести какую-нибудь вероятностную методику. umap посмотрю.

Igor Danilov
Я понимаю под закономерностями информацию, содержа...

чет мне кажется, стоит начать с математики за SVD, PCA и прочими линейными отображениями.

Igor-Danilov Автор вопроса
Stanislav Demchenko
чет мне кажется, стоит начать с математики за SVD,...

Буду благодарен за конкретику, и можно в лс) Пока не понял, почему вы так считаете.

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
Подскажите, а есть vault lite или ченить такое?) А то нужен вольт для похода в вольт, но весит он ~500 мб) как-то многовато для парочки запросов ))
Alexandr Orloff
17
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Карта сайта