меня есть данные за полгода, но в них есть 3 периода пропусков по 3-5 дней. У меня вопрос, что с этими днями лучше сделать: оставить пропущенными, заменить на среднее для этого дня недели, ещё что-то?
У меня такая же проблема в своё время была. Ответ нашёл вот тут вот https://stats.stackexchange.com/questions/346225/fitting-arima-to-time-series-with-missing-values
imputeTS. Годная штука для миссингов. https://cran.r-project.org/web/packages/imputeTS/index.html
Тренд в эти дни неизвестен в принципе, остается только периодический компонент серии. Вот его туда хлопс, и будет нормально
Хотя если есть сильно выраженная периодичность, то голая арима - вряд ли оптимальное решение (В теории, а на практике может взять заработать всем на зло)
Я как раз о чем-то таком думала, но в более прозаичной форме: период 7 дней, так что среднее по дням недели думала запихать
Авто-арима кстати тоже зло :) Вроде ми-ми-ми, а потом нормально стат. Тесты не идут :)
На похожих данных относител но нормально работала. Мне не нужна суперточность
Плохая идея. Лучше спекральная экстраполяция
На месяцах можно еще сделать, а на днях — там условный эпсилон может быть важен.
можно сделать как завещал дедушка Тьюки — сглаживание по тройкам или ганнирование
Речь идёт о spectral estimation & time-series extrapolation? Я нашла только пару статей. А примеров/гайдов вы не видели?
Предлагаю с фильтра Калмана above :)
Я в последнее время вернулся к теме GAM. Отличная штука, в т.ч. для временных рядов. И придумана давно и удобна в применении. Модный ML все заглушил в инфополе... - https://www.statlearning.com/ - https://noamross.github.io/gams-in-r-course/ - https://fromthebottomoftheheap.net/ хорошая методологическая статья: https://pubmed.ncbi.nlm.nih.gov/31179172/#:~:text=The%20hierarchical%20GAM%20(HGAM)%2C,varies%20between%20different%20grouping%20levels.
Обсуждают сегодня