Добрый день. кто-нибудь может подсказать где почитать более детально про

А есть какой-нибудь конкретный профиль использования этих пропускающих индексов? У меня задача: ускорить обычные агрегирующие запросы к таблице с сырыми данными (лог событий), когда WHERE в запросе не имеет полей из ПК таблицы

0

26.02.2021

Denny [Altinity]

enclaved
А есть какой-нибудь конкретный профиль использован...

могу с уверенностью 88% сказать что skip индексы вам не помогут

0

26.02.2021

enclaved Автор вопроса

Denny [Altinity]
могу с уверенностью 88% сказать что skip индексы в...

Тогда еще один вопрос: ПК таблицы, записанный как ORDER BY (ts, a, b), будет участвовать в запросах, где есть WHERE ts = x AND b = y (то есть нет условия по полю a)?

0

26.02.2021

Loyd

enclaved
Тогда еще один вопрос: ПК таблицы, записанный как ...

Будет участвовать, да. Но если a часто меняется, то толку мало будет

0

26.02.2021

Denny [Altinity]

enclaved
Тогда еще один вопрос: ПК таблицы, записанный как ...

зависит от кардинальности ts, так ts это похоже на timestamp то нет. короче вопрос ЧТО ТАКОЕ TS ?

0

26.02.2021

enclaved Автор вопроса

Denny [Altinity]
зависит от кардинальности ts, так ts это похоже на...

Верно, именно timestamp события. Таблица - лог запросов к рекламному трекеру. Задача - сообразить ПК/индексы так, чтобы максимально быстро выполнять агрегирующие запросы пользователей, в которых могут быть любые комбинации WHERE и GROUP BY

0

26.02.2021

Denny [Altinity]

enclaved
Верно, именно timestamp события. Таблица - лог зап...

начните с ORDER BY (a, b, ts) если не подойдет то проверьте ORDER BY (toStartOfHour(ts), a, b) ORDER BY (toStartOfDay(ts), a, b)

0

26.02.2021

Loyd

enclaved
Верно, именно timestamp события. Таблица - лог зап...

1. А a и b у вас что? Тикер/номер компании? 2. Паттерн обычно какой: запрашивают по своей компании или сразу по многим?

0

26.02.2021

enclaved Автор вопроса

Loyd
1. А a и b у вас что? Тикер/номер компании? 2. Пат...

Запрашивают по своему id юзера разные кампании

0

26.02.2021

enclaved Автор вопроса

Loyd
1. А a и b у вас что? Тикер/номер компании? 2. Пат...

2. Даже так: обычно id юзера в WHERE, а id кампании часто в GROUP BY

0

26.02.2021

Loyd

enclaved
2. Даже так: обычно id юзера в WHERE, а id кампани...

Тогда можно что-то вроде OK = (user_id, timestamp) Масштабировать на кластер по user_id % X или консистентное хеширование

0

26.02.2021

Loyd

Loyd
Тогда можно что-то вроде OK = (user_id, timestamp)...

Ещё можно data skipping index bloom_filter завести на id кампании, если надо искать на большие промежутки, но с ограничением по кампаниям

0

26.02.2021

Slach [altinity]

enclaved
А есть какой-нибудь конкретный профиль использован...

ну IMHO тут очень сильно зависит от того как данные в ваших столбцах по которым вы пытаетесь data skip index размыты по разным system.parts data skip означает что при сканировании парт сначала проверяется что искомые значения ОТСУТСТВУЮТ в конкретном парт если есть вероятность что они есть. то идет обычное сканирование парта... то есть data skip index помогут если условия фильтрации по запросам данные локализованы именно в рамках 1-нескольких партов а если у вас user=1 на половине таблицы, то не помогут

0

26.02.2021

enclaved Автор вопроса

Loyd
Тогда можно что-то вроде OK = (user_id, timestamp)...

Вообще без id кампаний в OK? Бывают сравнительно часто запросы данных по конкретным кампаниям, то есть WHERE id юзера AND id кампании

0

26.02.2021

Loyd

enclaved
Вообще без id кампаний в OK? Бывают сравнительно ч...

Тут пробовать надо. Либо с bloom_filter индексом дополнительно, что такие запросы может ускорить, либо уже полноценная отдельная MV с сортировкой по кампании. Промежуточные варианты с toStartOfHour, как @den_crane выше предлагал это промежуточные по скорости варианты для обоих запросов.

0

26.02.2021

【D】【J】 · Accepted Answer

【D】【J】

в КХ есть только кластерный индекс, и скип индексы (с очень ограниченным пространством применения). грануларити обычно лучше не трогать

0

26.02.2021

184 похожих чатов

Добрый день. кто-нибудь может подсказать где почитать более детально про

19 ответов

Похожие вопросы