ивентов (50+ миллиардов строк) , каждому ивенту в таблице должна соответствовать одна строка, запись в таблицу возможна с дублированием ивентов, при вставке в таблицу пишется атрибут insert_datetime DateTime default now(), не является ли антипаттерном решение перепроектировать таблицу на engine = ReplacingMergeTree(insert_datetime) order by sipHash128(список всех атрибутов ивента) для того, чтобы хранить иметь возможность дедуплицировать ивенты в таблице?
Если дубликатов много и вы хотите сэкономить место, то это хорошая идея. Если мало, и вы хотите чего-то другого (например, гарантий уникальности), то, думаю, не очень хорошая.
Обсуждают сегодня