Есть вопрос по кликхаус копиру: есть кластер N шардов, данные которого

Question

Есть вопрос по кликхаус копиру: есть кластер N шардов, данные которого

надо перенести на новый кластер с M шардов
1) правильно ли я понимаю, что если я запущу один копиер на любом из кластеров, то он будет через одну точку тягать данные с N шардов на M шардов?
2) для лучшей параллельности процесса лучше ли будет запустить на каждой ноде шарда по копиеру и в source_cluster прописать 127.0.0.1 (тяни с меня, но не с соседней машины)?
3) если пункт 2 соблюдается, то улучшится ли параллельность процесса, если реплики тоже будут так данные передавать (или они законфликтуют по набору данных?)
4) --task-path надо для каждой ноды с копиером делать выделенный, или учитывая что сорс у меня 127.0.0.1 можно через один? не законфликтуют ли воркеры за task_active_workers ноду в зукипере?

#backend #clickhouse #database #devops #programming #russian

0

05.08.2020

1 ответов

48 просмотров

Denny [Altinity] · Accepted Answer

Denny [Altinity]

вам надо из N в M , читать надо через одну distributed писать в другую distributed -- через одну точку, иначе как? надо же решардить каждую строку. но так как партиций много и если воркеров много, будут задействованы все ноды

0

05.08.2020

184 похожих чатов

Есть вопрос по кликхаус копиру: есть кластер N шардов, данные которого

1 ответов

Похожие вопросы