большой таблицы (150bln) в такую же но Distributed  смотрящую на 10 шардов
                  
                  
                  Суть проблемы: вставка значительно медленнее чем просто вставить в шард напрямую.
                  
                  
                  Пробовал поставить  distributed_directory_monitor_batch_inserts=1 
                  
                  
                  размеры батчей 3-4 куска и не сильно быстрее получается, размеры кусков по 1-2Мб и табличку в 2Tб будет копировать неприлично долго.
                  
                  
                  Как можно ускорить вставку в Distributed ?
                  
                  
                
Как копируете?
Distributed всегда медленнее чем напрямую. Это совершенно нормально. Надо смотреть на ключ шардирования, и возможно предсортировать по нему select
Обсуждают сегодня