нужно указать internal_replication в значении true? Иначе будет писать во все реплики даже когда там уже есть запись?
internal_replication true говорит движку distributed что вставлять только в одну реплику из шарда Потому что подразумевается что underlying тпблицы будут replicated merge tree И данные через zk отреплицируются Насчет данные уже есть Дедупликация делается на уровне блоков на уровне контрольных суми В zk хранятся котнрольные суммы последних вставленных блоков для replicated mergetree
Обсуждают сегодня