184 похожих чатов

Что лучше для борьбы с дубликатами - MergeTree и периодически

выполнять OPTIMIZE TABLE FINAL DEDUPLICATE или ReplacingMergeTree?

5 ответов

27 просмотров

Ни то, ни другое, по сути, @solard сказал правду своей шуткой, необходимо все-таки на стороне приложения дедуплицировать данные

зависит от движка таблицы, для каждого движка есть свои методы, ведь дубли не удаляются сразу, могут вообще никогда не удалятся, поэтому в самой таблице дубли могут быть, но от них можно избавиться в запросе селекта Для движка ReplacingMergeTree есть такие практики финализации в запросе (https://kb.altinity.com/engines/mergetree-table-engine-family/replacingmergetree/#single-key), я предпочитаю в Replacing делать через LIMIT 1 BY <названия ваших полей>, вообще не рекомендуется делать через FINAL, но можно для небольших таблиц, справочников, например Для CollapsingMergeTree прикол заключается в использовании поля Sign в выражении (https://clickhouse.com/docs/ru/engines/table-engines/mergetree-family/collapsingmergetree/#primer-ispolzovaniia), умножить числовые данные поля на Sign и сложить, тогда дубли самоуничтожатся, тк они разного знака

https://kb.altinity.com/altinity-kb-schema-design/row-level-deduplication/

Kuzma-Leshakov Автор вопроса
Кирилл Маньков
зависит от движка таблицы, для каждого движка есть...

а вы пробовали на практике использовать CollapsingMergeTree ?

Похожие вопросы

Обсуждают сегодня

Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Hi guys, I'm looking for a good LLM course. Is there any course to learn LLMs in advanced? I'm aiming to use them in my apps, so a perfect course in my openion, is not only a ...
Taha
14
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
Всем привет. Подскажите, пожалуйста, как вы реализовываете следующий функционал. Допустим есть форма, в которой имеется выпадающий список со значениями. Значения хранятся в БД...
Евгений
7
Хех, данные на форме всегда будут "из прошлого", т.к. перезаполнять поля формы в процессе редактирования пользователем - так себе идея. Пользователь может открыть форму редакт...
Alexander Somov
7
$params = [ 'formid' => 'feedbackForm', 'formTpl' => '@CODE: <form class="form-validate" data-id="ajax_form"> <fieldset class="margin-bottom-md"> ...
Pathologic
1
Хотел бы спросить у знающих, правильную ли я выбрал книгу для начала изучения ассемблера Юрова В.И ? Или есть более лучшие книги для начала обучения?
Botsman
31
Карта сайта