169 похожих чатов

Добрый день! Вопрос, наверное, дурной, но я как-то основательно подвис. Нашел

очень интересный метод для моей задачи. Хочу попробовать. Факторный анализ?- смотрю в лекции Абакумова, использую factanal(), вылетает с ошибкой, что данные коллинеарные. Как? Разве факторный анализ не создан для того, чтобы уменьшать размерность данных, в том числе за счет объединения коррелирующих переменных? Гуглю, что еще делает факторный анализ. Psych::fa() – та же проблема, не ест коррелированные данные.  Это у меня какое-то не такое понимание факторного анализа?

Вспоминаю, что из этой же области метод главных компонент (который не очень понятно для меня объяснял Карпов на степике). Пробую его применять «в лоб», на коррелированных данных с ним все ok, но не он используется же в найденном видео. Боюсь, что из-за моего непонимания математической сущности получится чушь. Но нахожу в интернете, что «факторный анализ и метод главных компонент обычно дают очень близкие результаты…»

Собственно вопросы.
1.Можно ли заставить факторный анализ работать с коррелированными переменными. Если да, то как?

2.Можно ли вместо факторного анализа использовать метод главных компонент? Что тогда оттуда брать для использования в методе из видео- rotation matrix?

3.И в добавок возник вопрос. Вот сделали fit<-factanal(x_старые). Из fit можно достать значения факторов для каждого x_i. Теперь есть множество x_новые. Хочу узнать для них значения факторов по уже обученной модели. Можно ли это как-то сделать? И, можно ли достать из модели «формулу», чтобы считать значения факторов вне R.

1 ответов

7 просмотров

я сто лет не использовал факторный анализ и почти столько же не делал его в R насколько я помню, там дело в том, что факторный анализ, конечно, да, предназначен для снижения размерности данных. однако когда данные (или некоторые переменные) высоко скоррелированы, получается вырожденная матрица, и, по сути, нет возможности найти какие-то латентные факторы. мне даже вспоминается эвристика, что хорошо бы сначала просто посмотреть матрицы корреляций, и корреляции вы 0.9 просто руками пофиксить. и наоборот, если все переменные слабо скоррелированы, то факторный точно так же плохо взлетит. метод главных компонент и методы факторного анализа очень близки по логике, вопрос в том, как подходят к оценке общей дисперсии. метод главных компонент это, по сути, линейное преобразование, факторные анализы - именно попытка найти латентные переменные, обеспечивающие общую дисперсию.

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
Кибер Бомж
8
Карта сайта