optimize final, чтобы принудительно запустить удаление дублей
Вроде где-то читал про 8 минут
Идёт в фоне, но нет гарантии отсутствия дублей
какой параметр отвечает в настройках?
мержи в КХ запускаются в неопределённый момент времени в будущем, и могут вообще не запуститься
а где про это почитать?
Data deduplication occurs only during a merge. Merging occurs in the background at an unknown time, so you can’t plan for it. Some of the data may remain unprocessed. Although you can run an unscheduled merge using the OPTIMIZE query, do not count on using it, because the OPTIMIZE query will read and write a large amount of data. https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/replacingmergetree
ещё есть такая настройка https://github.com/ClickHouse/ClickHouse/pull/42423
Обсуждают сегодня