timestamp DateTime,
counterId UInt64,
userId UInt64,
a String,
b String
) ENGINE = MergeTree
PARTITION BY toYYYYMM(timestamp)
ORDER BY (timestamp, counterId);
SELECT userId, a, b
from t1
PREWHERE timestamp > '2019-12-01 00:00:00'
and timestamp < '2020-01-01 00:00:00'
and counterId = 123;
В ней много различных и timestamp и counterId
Есть пара вопросов:
1) имеет ли разницу в каком порядке поля расставлены в ORDER BY для этого запроса?
2) Пробовал убрать фильтр and counterId = 123 и в логах вижу, что количество прочитанных mark особо не отличается.
Selected 9 parts by date, 9 parts by key, 139467 marks to read from 9 ranges
Reading approx. 1097344914 rows with 12 streams
vs
Selected 9 parts by date, 9 parts by key, 139408 marks to read from 64 ranges
Reading approx. 1097247559 rows with 12 streams
С чем это может быть связано?
Подскажите куда смотреть, плз.
Понятно, что можно более мелко партицировать, но у меня есть ощущение, что неправильно используется индекс.
Да имеет ORDER BY counterId, timestamp сделайте более низко кардинальное поле лучше в начало индекса
Вам в order by таблицы надо поля местами поменять
Обсуждают сегодня