?
Да, в вашей постановке, это пуассон. Если захотите использовать gam, то не надо перекодировать ни в квадраты,ни в дамми. В пакете mgcv есть специальные сплайны и для координат и для времени с периодами. К сожалению, на практике именно этими сплайнами не пользовался, так что надо читать доки
Спасибо большое, я квадраты делал больше для визуализации. В год назад мне было сказано что Пуассон глм, написал работу , принёс и разбили в пух и прах.
Интересно, а какая была аргументация? При наличии трафика это была бы логистическая (биномиальная) регрессия, что более корректно. Тогда вы как бы оцениваете вероятность попасть в дтп в данном месте в данное время. Биномиальную можно перевести в Пуассона достаточно просто (опять -таки, если есть траффик). У Пуассона достоинство, что коэффициенты проще интерпретировать по сравнению с логистической регрессией
Интеракция, высокая дисперсия , ну и наверное что консультант видел другое решение
звучит как задача для пространственной автокорреляции и стат моделей вокруг
Именно так я и думал брал за основу это https://tsamsonov.github.io/r-spatstat-course/spreg.html , но всё пошло не так
а есть примеры применения этого к реальной жизни, где происходит в т.ч. такое? https://www.youtube.com/shorts/DOom9vSXetI
что это такое... реальная жизнь...
Я думаю вам стоит также искать причинно следственную связь, кластерный анализ. У вас будет не одна модель на все дтп, а возможно и по модели на каждый участок или квадрат
Именно так у меня и реализовано, только место кластеров я сгруппировал по квадратам
Квадраты 1000м2, 500м2 и 250м2 , то есть три варианта , но консультант сказал что это всё не то , хотя в тот год было одобрено. А
Не то, если цель найти одну модель на все квадраты
Тогда смысл этой работы? И что модель будет считать , что завтра в пятницу их будет 100 а в субботу 200?
Смысл работы вы нам должны объяснить. Как я понимаю: построить модель которая предсказывала бы вероятность аварии для конкретной комбинации предикторов, причем среди предиктороа должны быть пространственные факторы. Разбивать на квадраты и тренировать отдельные модели может быть нерационально так как «выбрасываете» полезную информацию. Вопрос в том как использовать пространственные факторы: напрямую как long/lat или через агенте факторы
Модель рассчета дтп
Обсуждают сегодня