большой таблицы (150bln) в такую же но Distributed смотрящую на 10 шардов
Суть проблемы: вставка значительно медленнее чем просто вставить в шард напрямую.
Пробовал поставить distributed_directory_monitor_batch_inserts=1
размеры батчей 3-4 куска и не сильно быстрее получается, размеры кусков по 1-2Мб и табличку в 2Tб будет копировать неприлично долго.
Как можно ускорить вставку в Distributed ?
Как копируете?
Distributed всегда медленнее чем напрямую. Это совершенно нормально. Надо смотреть на ключ шардирования, и возможно предсортировать по нему select
Обсуждают сегодня