А почему ORDER BY по первичному ключу так роняет

Question

А почему ORDER BY по первичному ключу так роняет

производительность?

есть таблица

CREATE MATERIALIZED VIEW item_status_mv
(
`item` String,
.....
.....
)
ENGINE = AggregatingMergeTree
PRIMARY KEY item
ORDER BY item

Запрос

SELECT
ds.item
FROM item_status_mv AS ds
FINAL
WHERE
ds.item > ''
ORDER BY item
LIMIT 1000;

Выполняется за большое время, "1000 rows in set. Elapsed: 11.728 sec. Processed 401.69 million rows"

если убрать FINAL или ORDER BY то все летает.

Почему клик не хочет использовать индекс? Ведь по логике все просто и легко идем по индексу , считали все записи для первого item , сделали финальную аггрегацию и отдали, повторили для второго item. Но клик зачем-то считывает всю базу

#backend #clickhouse #database #devops #programming #russian

0

24.07.2021

4 ответов

25 просмотров

Nekto Автор вопроса

По идее, можно клик заставить работать как хочется путем запроса SELECT ds.item FROM item_status_mv AS ds FINAL WHERE ds.item > '' GROUP BY item LIMIT 1000 SETTINGS optimize_aggregation_in_order = 1 Те заменить ORDER BY на GROUP BY + optimize_aggregation_in_order , но часть запросов отрабатывает нормально, а часть запросов валится с ошибкой Progress: 26.42 million rows, 1.30 GB (6.24 million rows/s., 306.06 MB/s.) ███▍ 6% Received exception from server (version 21.1.10): Code: 49. DB::Exception: Received from 127.0.0.1:9000. DB::Exception: Pipeline stuck. Current state: digraph { rankdir="LR"; { node [shape = box] n140638677604384[label="MergeTree(1565 jobs) (PortFull)"]; n140638673862688[label="MergeTree(5 jobs) (PortFull)"];

0

24.07.2021

Nekto Автор вопроса

Zheka
а optimize_read_in_order пробовали?

SELECT ds.item FROM item_status_mv AS ds FINAL WHERE ds.item > '' GROUP BY item LIMIT 1000 SETTINGS optimize_aggregation_in_order = 1, optimize_read_in_order= 1, max_threads = 2 тоже валится, но причиной оказлся max_threads = 2 , я его не указал в исходном сообщении Поэтому теперь уже два вопроса :) 1) Почему ORDER BY не использует индекс 2) max_threads=2 и падение с ошибкой - это нормально или бага?

0

24.07.2021

Zheka

Nekto
SELECT ds.item FROM item_status_mv AS ...

я имел в виду без group by, а с order by попробовать указать optimize_read_in_order= 1

0

24.07.2021

Zheka · Accepted Answer

Zheka

Nekto
По идее, можно клик заставить работать как хочется...

а optimize_read_in_order пробовали?

0

24.07.2021

184 похожих чатов

А почему ORDER BY по первичному ключу так роняет

4 ответов

Похожие вопросы