Коллеги, добрый вечер! Изучаю и практикую clickhouse, есть вопрос один. На

Question

Коллеги, добрый вечер! Изучаю и практикую clickhouse, есть вопрос один. На

данный момент разрабатываю pipline впервые, гружу данные в clickhouse(использую файлы в папке), но clickhouse позволяет загружать дубликаты. Что делать в таком случае?
Сделать архитектуру с помощью которой файлов там не будет?
Это ок, так и будет.

Но вопрос все равно интересный, что насчет дубликатов и уникальности? Кто что делает в таком случае?

#backend #clickhouse #database #devops #programming #russian

0

04.10.2020

10 ответов

39 просмотров

Пользователь 61745

https://clickhouse.tech/docs/ru/engines/table-engines/mergetree-family/replacingmergetree/

0

04.10.2020

Пользователь 61745

Но тама есть особенность, дубли сразу не уйдут, а может и совсем не уйдут.

0

04.10.2020

Anvar Khamidov Автор вопроса

Пользователь 61745
Но тама есть особенность, дубли сразу не уйдут, а ...

хмм

0

04.10.2020

Anvar Khamidov Автор вопроса

Пользователь 61745
Но тама есть особенность, дубли сразу не уйдут, а ...

решение есть на эту особенность?

0

04.10.2020

Пользователь 61745

Anvar Khamidov
решение есть на эту особенность?

Вручную делать OPTIMIZE, но это как я понимаю не рекомендуется часто делать. Если дублей мало я бы забил и на этапе select это решал просто.

0

04.10.2020

Denny [Altinity]

удаляем дубликаты до КХ кассандрой, сам КХ не может смержить, не хватает скорости дисков

0

04.10.2020

Anvar Khamidov Автор вопроса

Denny [Altinity]
удаляем дубликаты до КХ кассандрой, сам КХ не може...

интересно, спасибо за инфу

0

04.10.2020

Denny [Altinity]

Anvar Khamidov
интересно, спасибо за инфу

т.е. у кх все хорошо, например есть 5 партов в месяц размером по 200ГБ, если пытаться мержить в один парт чтобы удалить дубликаты, диски задыхаются и селекты не выполняются, ну такой мерж параллельно с инсертами идет несколько дней

0

04.10.2020

Anvar Khamidov Автор вопроса

Denny [Altinity]
т.е. у кх все хорошо, например есть 5 партов в мес...

хмм, понял

0

04.10.2020

Пользователь 61745 · Accepted Answer

Пользователь 61745

движок поменять на реплесинг

0

04.10.2020

184 похожих чатов

Коллеги, добрый вечер! Изучаю и практикую clickhouse, есть вопрос один. На

10 ответов

Похожие вопросы