Тогда не пойму такого поведения: Таблица: CREATE TABLE skip_idx (

Question

Тогда не пойму такого поведения: Таблица: CREATE TABLE skip_idx (

`value` UInt32, `id` UInt32, `ts` DateTime
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(ts)
ORDER BY tuple();

Добавляю индекс:
ALTER TABLE skip_idx ADD INDEX test_idx `value` TYPE minmax GRANULARITY 1;
ALTER TABLE skip_idx MATERIALIZE INDEX test_idx;

Заполняю данными:
INSERT INTO skip_idx SELECT
rand(), number, now() + intDiv(number, 10)
FROM numbers(1000000000);

Делаю поиск по ключу value:
SELECT count() FROM skip_idx WHERE value = 214678225
Результат:
1 rows in set. Elapsed: 0.191 sec. Processed 1.00 billion rows, 4.00 GB (5.25 billion rows/s., 20.99 GB/s.)

Почему при имеющемся индексе, выполняется просмотр всех данных таблицы?
А также почему при гранулярности 1, выполняется просмотр всех гранул, а не остановка после первого вхождения, ведь дальше должны идти значения заведомо больше искомого:

Expression ((Projection + Before ORDER BY)) │
│ Aggregating │
│ Expression (Before GROUP BY) │
│ Filter (WHERE) │
│ SettingQuotaAndLimits │
│ ReadFromMergeTree │
│ Indexes: │
│ MinMax │
│ Condition: true │
│ Parts: 232/232 │
│ Granules: 122097/122097 │
│ Partition │
│ Condition: true │
│ Parts: 232/232 │
│ Granules: 122097/122097 │
│ Skip │
│ Name: id_idx │
│ Description: minmax GRANULARITY 1 │
│ Parts: 232/232 │
│ Granules: 122097/122097 │

#backend #clickhouse #database #devops #programming #russian

0

18.03.2022

10 ответов

55 просмотров

Pavel Pavlov Автор вопроса

Boris
>А также почему при гранулярности 1, выполняется п...

Так во время построения индекса это условие и должно проверяться и сохраняться в индексе. А после, при поиске значения в индексе и его обнаружении, брать из него положение этих данных, например номер куска и смещение в нем, и читать. Или как-то иначе?

0

18.03.2022

Ivan Kalinin

Pavel Pavlov
Так во время построения индекса это условие и долж...

Какое условие?

0

18.03.2022

Константин

Ivan Kalinin
Какое условие?

Нет, он про то что вроде каждой грануле было сказано, какое максимальное, а какое минимальное число, в ней и они должны быть отсечены

0

18.03.2022

Pavel Pavlov Автор вопроса

Ivan Kalinin
Какое условие?

При построении индекса minmax должен формироваться упорядоченный список значений колонок по которым этот индекс строится. Соответственно, если делать запрос с использованием этого индекса на равенство, то при совпадении, даже если просто просматривать весь индекс, поиск должен заканчиваться при первом большем, чем запрошенное, значении. Этого не происходит в примере, что я скинул.

0

18.03.2022

Boris

Pavel Pavlov
При построении индекса minmax должен формироваться...

Нет. В этом ваше заблуждение, идущее корнями к индексам постгреса. Тут не так, мы про это сказали уже не раз. Попробуйте от него отказаться.

0

18.03.2022

Pavel Pavlov Автор вопроса

Boris
Нет. В этом ваше заблуждение, идущее корнями к и...

Так вот я и пытаюсь понять фундаментальные отличия, на которые можно будет опираться при планировании индексов. Но так и или иначе, любой индекс должен на что-то ссылаться. На что ссылается индекс пропуска, как он адресует искомые данные?

0

18.03.2022

Ivan Kalinin

Pavel Pavlov
Так вот я и пытаюсь понять фундаментальные отличия...

Ренж гранул

0

18.03.2022

Константин

Pavel Pavlov
Так вот я и пытаюсь понять фундаментальные отличия...

https://clickhouse.com/docs/ru/engines/table-engines/mergetree-family/mergetree/

0

18.03.2022

Boris

Pavel Pavlov
Так вот я и пытаюсь понять фундаментальные отличия...

Записи индекса пропуска ни на что не ссылаются. В них есть информация, которую можно проверить и принять решение о пропуске набора гранул.

0

18.03.2022

Boris · Accepted Answer

>А также почему при гранулярности 1, выполняется просмотр всех гранул, а не остановка после первого вхождения, ведь дальше должны идти значения заведомо больше искомого Там нет никакой последовательности. Данные у вас никак не отсортированы. Гранулы идут в случайном порядке, поэтому нужно проверять minmax для всех.

184 похожих чатов

Тогда не пойму такого поведения: Таблица: CREATE TABLE skip_idx (

10 ответов

Похожие вопросы