2 реплик. ReplicatedMergeTree, 3 ноды Zookeeper, и "прокси" Destributed, через которую данные льются.
Пара сотен инсертов в секунду, реализовать пакетный ввод сейчас не представляется возможным. Ноды достаточно нагружены по диску, так же сильно дёргают Zookeeper.
Имеет ли смысл вкорячить Buffer в цепочку? И если да, то где? Перед Distributed на прокси, или перед перед ReplicatedMergeTree на датанодах? Мне видится правильным первый вариант.
И получится ли таким образом снизить кол-во запросов в Zookeeper? То есть запросы туда идут per row или per insert (batch)?
На batch, но если не можете слать пачками то в КХ лучше не лезть
Обсуждают сегодня