которые нужно расшардить. INSERT INTO .. SELECT в Distributed таблицу занимает много времени. Есть какой-то другой вариант (без длительного downtime)? Можно, например, сделать INSERT SELECT при включеной базе, потом остановить базу и дозалить инкременты?
Кажется проще всего поднять рядом шардированный кластер, переключить запись туда и долить старые данные через insert... select
+1 я бы сначала начал новые данные в новую схему лить и старые перелил бы отдельно вместо DISTRIBUTED можно наверное INSERT INTO ReplicatedMergeTree ... SELECT FROM remote(, mergetree_table) WHERE ...
Спасибо за совет!
Обсуждают сегодня