и Y, которые получены из распределения двух значений на карте и на их основе создан датасет по сетке, то есть столбцы X, Y и id (для удобства) со значениями в каждой точке. Значений много, чуть больше 100к. Посчитав корреляцию Пирсона через pandas получил значение в чуть больше 0.3 с p значением в 0, что с натяжкой можно назвать умеренной корреляцией, однако со статистической значимостью (как я понял). Я же правильно понимаю, что в таком случае нельзя сказать, что фактор Y существенно влияет на фактор X и для более корректного и четкого предсказания необходим поиск дополнительных факторов, влияющих на X, в дополнение к этому фактору?
На картинке диаграмма рассеяния двух параметров, в целом он подтверждает тенденцию этих двух параметров к взаимному увеличению значений на карте в определенную сторону, если построить градиент
Если это какое-то социологическое исследование (например, связь рождений вне брака от брачного состояния бабушек рожающих женщин), то связь есть, если медицинское (эффективность лекарства, то есть излечения от применения препарата) - связь слишком слабая
Не могу одним словом описать) Скорее это геоинформационно-биологически-климатическое
Вы вообще через корреляцию не можете делать вывод о влиянии. Попробуйте посмотреть размер эффекта и оцените его.
Обсуждают сегодня