на части кейсов, мне в соседнем чатике сказали такое, мб подскажете что этот господин имеет в виду?
> Не догонят, уже Миловидов поставил крест, теперь кх - это однозначно тупо для кликстрима + метрики/логи.
в этом году планируются проекции, но в целом КХ > vertica в базоывх кейсах имхо уже... ну а кейсы которые двигает вертика в последние годы - они очень специфичны так что, смотря для чего вам это надо... если обосновать - то можно повернуть в любую сторону в какую надо
у вас какой use case то? вы лучше от задачи пляшите
Я инженер в компании которая делает свою СУБД (Терадата), пишу там тулинг для data science (сейчас речь конкретно про feature store), но я пытаюсь делать его агностичным для БД, и мне нужно понять надо поддерживать КХ
ну, именно под хранение фич clickhouse норм еще и с caboost моделями интеграция есть, но специфичное достаточно (обучение на стороне clickhouse так и не доделали) конкретно какие запросы будете делать к хранилищу? аггрегаты какие то? тулинг на python ?
Да, там по сути генератор джоинов или вьюшек, с ограничениями по датам или темпоральным (кстати КХ умеет ансишную темпоральность?) Мне нужно чтобы хорошо работал query rewrite (переставить пяток inner join в оптимальную последовательность) ну и dynamic partition elimination на джоинах
кх не умеет переставлять джоины > dynamic partition elimination такого тоже не припомню
даже планов нет, это нужно .00001% пользователей КХ
Получается что там где пользователи полагаются на оптимизатор СУБД на КХ принято денормализовывать или писать запросы зная статистику данных? Как идиоматично селить пользователей с ад-хок запросами обычно в КХ?
У меня adhoc запросы. Вообще ни одного запроса не написано разрабами. Все запросы генерятся бекэндом.
Как вы задаёте последовательность джоинов?
да нету почти джойнов, 99% на словарях. Джойны бекенд пишет лесенкой, он написан до мультиджойна
с JOIN у Clickhouse так себе
темпоральности тоже нет сделать как в Vertica выборку "на заданный" EPOCH, не получится
Обсуждают сегодня