в качестве примеров работы функций cross-correlation показываются "стройные колбаски" с корреляцией ~ 0.7.
Мне же реальность нарисовала совсем иные фигуры и несмотря на то, что корреляция там сильно выше (~ 0.86), не могу избавиться от ощущения, что эти "веера" намекают на что-то сильно отличающееся от простой линейной зависимости.
Мастицкого и красную книгу полистал -- там деталей по этому вопросу не нашёл.
Куда гуглить?
попробуйте выкинуть выбросы с использованием IQR и логорифмировать
А можно без "прокрустового ложа"? Мне б феномене разобраться, а не свести задачу к типовой.
Хотя, признаться честно, сюда я чаще захожу за обратным.
так феномен очень простой, в реальных данных часто скрыты ошибки измерений, которые в модель пускать не нужно ... логорифмирование - это просто попытка получить нормальное распределение, есть еще преобразование Бокс-Кокса, попробуйте тоже
Напоминает разброс по фьючам на одной паре по объёму/цене актива
А если исходить из того, что это чистая характеристика коррелируемых фичей? По крайней мере одной из двух -- точно.
Может потому, что это корреляция цены битка с жужжанием в интернетах?
так можно исходить из чего угодно, природе вообще основательно плевать как мы ее воспринимаем, давайте фактуру того, что за данные и тогда обсудим природу возможных искажений
все ценовые истории имеют логнормальное или около того распределение
Ну вот цена битка -- это "реальность, данная нам в ощущениях". Тут ошибке измерения взяться неоткуда. У второго временного ряда (интернетное жужжание) ошибки измерений, естественно, есть. Одна из них связана тупо с тем, что регулярно добавляются новые источники жужжания.
цена битка может формироваться на низкой ликвидности, что как раз может быть не вполне объективным замером... т.е. брать котировки битка из 2014 года - уже немного не то
Жёска. Да там по объему жужжания и офигеть можно. Ещё же есть всякие даркнеты, или по принципу Аваланча были засланы боты для сканировария?
Ну в данных по зарплатам, выручке и подобному я к такому привык, да. То, что с ценами также для меня новость.
экономика - она такая )) попробуйте логорифм взять, дольше обсуждать природу этой операции чем просто посмотреть результат
Без даркнетов. Все "обычные подозреваемые", парсинг которых не имеет юридических рисков.
помню на заре криптопомешательства биток хорошо следовал за ICO и еще чуть позже за google trends , но потом туда пришли большие деньги и понеслось ...
Настолько дзен битка я ещё не познал. Спасибо, интересно. Давно не сталкивался с предметной областью в которой я ничего не понимаю, но при этом мне действительно интересно.
Я сегодня хотел тут спросить, где пожать руку Мастицкому за то, что его книга по анализу временных рядов построена на примерах из криптовалют =)
он в Лондоне, год назад с ним разговаривали ))) думаю, он уже не вернется, он выступал на конференции R т.е. виртуально пожать ему руку можно
Ну можно поехать в Лондон. Пожать руку Мастицкому отличный повод, я считаю
Если гора не идёт к Магомеду ... ;)
Для меня взятие логарифма -- это способ запихнуть неудобную реальность в удобную модель. А тут в кои-то веки приспичило в структуре реальности разобраться. От того, что я принесу коэффициент корреляции 0.96 вместо 0.86 радикальной разницы не будет.
производная по логорифму - это функция в знаменателе т.е. по факту с точки зрения экономики вы просто переходите от абсолютных величин к процентным (относительным) т.е. такой трюк имеет вполне нормальное аналитическое и интерпретируемое обоснование ))
What do we say to the god of calculus?
"почему я прогуливал пары в вузе?" :)))))
Согласно моим картам, цена вопроса если сильно надо -- 12 видосов: https://app.learney.me/
Вот тут можно посмотреть исходник: https://app.santiment.net/s/d9HJnEpm
Мне это напоминает фильмы с Кейджем и самоубийства в США. Скоррелированы? Да. Влияют ли друг на друга? Нет.
Но в целом в этом чате такие вещи стоит упоминать разве что в ироничном ключе.
Ну в теории можно поискать причинность и посмотреть эндогенность
Очень интересно, никогда в жизни не смотрел глазами на такой разброс, всегда пихал в линейную (а потом в нелинейную) модель лаги и смотрел на важность фичей. А ведь зря, наверное, на этих графиках можно чё то и увидеть!
Осталось только понять, что именно на них можно увидеть.
Обсуждают сегодня