на другое железо в другом датацентре. Пошел изучать форматы хранения и вижу, что Native is the most efficient format. Взял один запрос (получение первых 100 миллионов записей) и сделал экспорт в три формата: native, parquet, tsv, пожатый в gzip потом. последние два получились примерного одного размера, а первый почти в 6 раз больше. я что-то делаю не так или паркет в итоге самый эффективный по объёму?
Native без сжатия вроде, нужно дополнительно указать А почему не использовать для миграции INSERT INTO SELECT?
там данных терабайт на 30, поэтому не рискую так делать, любой сбой сети и заново начинать
Так переливайте по партициям с помощью INSERT SELECT
он по сети будет пересылать уже сжатые куски в этом случае?
clickhosue-copier есть для этих целей вроде..
эффективный в смысле что его быстрее всего читать. хотя после gzip он тоже меньше чем пожатый TSV всегда
Обсуждают сегодня