разных серверов ch?
1. select from remote sql
2. clickhouse-driver python
3. clickhouse-copier
4. clickhouse to file -> file to server -> file to clickhouse
может что-то еще, или что самое быстрое из перечисленного?
собрать данные с нескольких независимых серверов на один? Я бы для такой задачи попробовал MV to Distributed. И не раз в сутки, а непрерывно. Если же надо именно раз в сутки, и данных НУ ОЧЕНЬ МНОГО, а так-же есть желание попрограммировать в стиле п.4, то можно копировать парты по scp, а затем аттачить их к общей табличке. Это будет наиболее эффективно, т.к. не будет постоянного рекомпреса данных, и по сети будут ходить только компрессованные.
SELECT * FROM remote(..) WHERE вполне быстро и чтобы сжатие было включено в протоколе еще
1 vs 2 чанками - 300minutes vs 2 minutes
Обсуждают сегодня