ряд с постоянно возврастающими значениями, и мне в этом ряду нужно найти change point, рост после которого явно выше, чем до него, и после нахождения - при помощи стат.теста валидировать что найденная точка - то, что нужно.
У меня ряды были по типу [1, 2, 3, 10,11, 12], я использовал двойной КС-тест с гипотезой "распределение элементов до поинта = распределение элементов после поинта", где отвергание гипотезы = подтвеждение того, что поинт - тот что нужен.
Сейчас же у меня помимо рядов выше, появляются ряды с гораздо меньшим ростом, к примеру - [1,1,1.2,1.21,1.22] и двойной КС тест найденную точку не отвергает.
Какой тест следует взять, чтобы гипотеза отвергалась и в рядах первого типа, и второго?
А точек много? Нельзя просто зафитить что-то типа логистической функции или tanh?
https://facebook.github.io/prophet/docs/trend_changepoints.html
Диффните и все :)
взять дифференциал и найти наибольшую разницу? можно, только от вопроса "как валидировать" не спасает
Ченджпоинт легче всего находить в стационарной серии
вопрос в том, что такое "валидировать", мне кажется статистически — будут проблемы, как Андрей говорил другие методы — будут они для вас "достаточно валидны"
Нужно найти точку где круче всего изменяется или все точки после которых изменяется?
круче всего, а потом прикрутить стат.тест, который подтвердит\опровергнет гипотезу о том - что выбранная точка = ченж поинт
Честное слово, ну ерунда какая-то в постановке задачи. Если все топором рублено, то просто смотреть первую производную. А если в реальности — то там еще и шум появится. Вот, было же развлечение: https://t.me/datasciencechat/233480 Слов нет. В постановке задачи уже должно быть 80% ответа.
так проблема - не найти, а валидировать при помощи теста, что точка та - что нужно
Что такое "То что нужно"?
Проблема в постановке задачи.
Вот читаю вопрос
Обсуждают сегодня