х2 реплики) - добавили железа и сформировали новыйх (3х2). Имеем 2 кластера. Так как решардинг не работает, создали дистрибутед таблицу на новом кластере и простым insert to x select from old_x данные переливаем (из дистрибутет в дитрибутед). но как-то уж очень медленно дело идет. больше 150-200 мегабайт в сек не поднимается скорость. при простом iинсерте из csv скорость раза в 3-4 выше. Куда посмотреть в таком случае?
это кажется ожидаемым, так как сначала данные должны приехать с шардов по сети, а затем разъехаться по по новым шардам, в то время как при обычном инсерте данные вставляются локально, а потом отсылаются асинхронно в фоне
Обсуждают сегодня