схему хранения данных
https://altinity.com/blog/2018-5-10-circular-replication-cluster-topology-in-clickhouse
Стоит вопрос как писать данные в него.
В distributed table или напрямую в шард? Через балансировщик или можно в одну машину все слать?
RPS порядка 10 батчей по 50-80к записей
Репликация и распределение по шардам это разные движки. Если вы пишите в распределенную таблицу, то она сначала туда целиком пишется, а потом раскидывается по шардам сама. Если напрямую - быстрее
В распределенную таблицу нормально писать? Где-то в доке было написано, что так не очень делать
У вас записей с гулькин нос
Тогда и можно в одну тачку ходить на запись без балансировщиков?
Не нужно делать циркулар, уж лучше 3 реплики
Как тогда быть с отказаустойчивостью?
Поддерживаю оратора выше. Идея плохая. Мне тоже очень хотелось сделать кластер из трёх нод с тремя шардами и replication_factor=2, попробовать я попробовал, конечно, но очень быстро понял, что это то слишком проблемно в эксплуатации, а выгоды при этом минимальные
Какая проблема в эксплуатации? Хочу знать проблемы на перед
Ну самое очевидное — это то, что хак с default_database, огрничивает тебя одной схемой (ну точнее двумя, где вторая под реплику), не будете же вы скидывать все таблицы в кучу в одну схему, база быстро превратится в помойку. Плюс через циклически реплциуемый кластер нельзя катить ddl с on cluster. Чтобы катить ddl нужно задавать другой кластер и изворачиваться с макросами
Обсуждают сегодня