Мы столкнулись со следующей проблемой.
У нас в связи с ограниченными ресурсами конфигурация вида 2 реплики, 1 шард. Таблица на движке ReplicatedMergeTree. Обе ноды за лоадбалансером. Льем данные из нескольких источников (консьюмеры очередей, mapred задачи). В итоге наступает такой момент, когда CH начинает давать "отлупы". Одно из решений - это увеличивать размер batch'а, но вопрос на сколько большим его можно сделать? Возможно знаете какие-либо другие варианты загрузить данные? Поделитесь опытом плиз.
Насколько угодно большим, по дефолту там ~1 миллион строк в блоке что обычно достаточно
Обсуждают сегодня