ключ сортировки в самое начало ? если добавить его в конце будет побольше профита же
там в начало добавляется дата, что мне показалось даже неплохой идеей если выборки идут за несколько дней а партиции по месяцам
В начало мы добавляем не сам таймстамп, а дату из него, допустим у вас часто идут запросы за последние 7 дней, но кардинальность host,http_host слишком большая и кликхаус не сможет использовать timestamp в конце ORDER BY для того что бы выбрать гранулы относящиеся к временному промежутку
ну кстати да, возможно так лучше)
я даже попробую. @unamedrus спасибо за идею!
Это кстати даст профит, если подключить КХ к графане, там обычно за последний день максимум выборка
я так понимаю, это если использовать выборки, если ВСЕГДА есть дата. А вот когда нужно будет выбрать where host = ‘qwe’ то будут вопросы, верно ?
кардинальность дат небольшая, так что кх сможет использовать вторую колонку из ORDER BY достаточно эффективно
мы говорим про datetime, но не date. Кардинальности datetime очень высока же
речь идет когда у нас ORDER BY toDate(ts), host, ..., ts
Да, тут понятно, почему будет лучше, спасибо! а если взять кейс, про дейтайм, в начала сувать его не оч хорошо ведь, верно ?
Задачи разные, в некоторых случаях это может быть оправдано Надо понимать зачем что то было сделано :)
это если в одну секнуду приходят сотни тысяч сообщений?
Или миллионы, да И выборки специфичные именно по маленьким промежуткам времени
Обсуждают сегодня