к кликхаусу для избежание дубликатов при вставке данных ? Планируется, что данные будут вставляться большими батчами и изначально без проверки на дублирование.
Движок таблицы ReplacingMergeTree, либо OPTIMIZE DEDUPLICATE FINAL
Я читал, что движок производит мердж данных с некоторой фоновой задержкой. Т.е, как я понял, после вставки какое-то неопределенное время данные будут дублироваться. Можно ли что-то сделать, чтобы сразу же после вставки получать уникальные данные? (Автоматически пересчитываются аналитические запросы после вставок, поэтому так важна достоверность)
https://altinity.com/blog/2020/4/14/handling-real-time-updates-in-clickhouse
Использовать модификатор запроса FINAL при SELECT
есть способы быстрее)
так как нет блокировок, то нет никакой гарантии, что пока один процесс вставляет уникальнейшие записи, второй параллельно не вставит дубликат
Обсуждают сегодня