(мы рекламу показываем)
делаю две сводных таблицы с агрегацией по часам ну и кучке разрезов
dimension столбцов - 9, данные лежат в ещё 5
нормально ли создать таблицу с sorting key в котором все 9 столбцов, не много?
вариантов сочетаний dimensions в итоге очень много, и в принципе не ограничено, потому что, например, там есть прекрасные столбцы age (2 порядка возможных значений), geo_id (6 порядков), segment_id (как бог положит)
ну и все остальные в сумме ещё больше
не знаю, важно ли это)
а чего вы хотите добиться таким order by? В чем замысел? Смотрите свои запросы и что там в where написано. Чаще всего в таких запросах в where указывают дату. Если это так, и у вас нет категории на 10-20 значений, то день и ставить на первое место. Остальное (6 порядков и более) может уже и не так существенно, только электричество на сортировки тратить.
запихивание всех дименшинов особенно высококардинальных в ORDERBY только ухудшает ситуацию. надо найти просто 2-3 самых важных и положить в таком порядке чтобы таблица хорошо сжалась. ну наверняка 90% запросов можно выразить/фильтровать через какой-нибудь banner_id и для остальных понаделать groupby проекций
Ну, например, так можно было бы использовать Replacing движок для потенциальных пересчётов статы
Обсуждают сегодня