от падения конкретного сервера. Начал углубляться в вопрос - нашел информацию и про шарды, и про реплики, и про distributed engine, и про zookeeper. Если мне нужно просто дублировать данные - что именно я должен использовать? Заранее спасибо за ответ!
Реплики, а чтобы были реплики нужен Zookeeper
https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/replication/
Шарды и distributed engine в моем случае вообще не нужны, верно?
какбы не нужны. distributed таблица имеет фичу, она умеет выбирать для запроса реплики которые не stale. т.е. если делать запрос прямо в replicated таблицу то может оказаться что выбираются несвежие данные потому что реплика отстала (например потому что репликация сломалась или реплика только что добавлена и еще не налилась)
В документации обнаружил clickhouse-keeper, стоит с ним возиться или начать с обычном zookeeper ?
Можно и keeper, насколько я понимаю, clickhouse-keeper (только правда с алгоритмами ошиблась, он совместим с ZK, но юзается RAFT). Более глубоко, конечно, в детали пока что не погружалась, но для начала можно посмотреть от Altinity доклад: https://youtu.be/wLHp_YcE4kA
сложный вопрос, с одной стороны он объявлен стабильным, с другой https://github.com/ClickHouse/ClickHouse/labels/comp-keeper
Обсуждают сегодня