скажем, то OPTIMIZE будет решать вопрос с дедупликацией быстрее\проще\с чтение и записью меньшего кол данных так как партиция один день а не месяц?
Я праильно понимаю что OPTIMIZE для ReplicatedMergeTree удалит дубликаты? или это я только хочу так
Это зависит от объёма данных в рамках партиции. В случае OPTIMIZE FINAL, все данные в рамках партиции сливаются в один кусок и вся фоновая работа происходит до конца. К настройке партиций надо будет относиться осторожно, так как слишком большое количество партиций приведёт к замедлению коротких запросов - надо будет делать много seek-ов. Месяц по-умолчанию выбран не просто так.
Обсуждают сегодня