его лучше указывать?
Вот допустим у нас есть Immutable Event Log по userId с eventType и eventId, а так же timestamp (DateTime).
Мы используем ReplacingMergeTree (на случай если два раза одно и тоже событие запишется в ClickHouse), на данный момент вот так:
ENGINE = ReplacingMergeTree PARTITION BY toYYYYMM(timestamp) ORDER BY (userId, eventType, eventId)
на сколько это правильно \ нет? ORDER BY очень сбивает с толку названием, я так понимаю он тут больше как кассандровский PRIMARY KEY, не?
зависит от того как вы потом будете все это читать.
Обсуждают сегодня