там сначала складывались в CSV файл, а потом заливались в КХ, сделано это было для того, чтобы заливаемые данные не дублировались
нубский вопрос ...
как правильно заливать такие файлы в рамках k8s кластера?
Дублирование данных не зависит от метода вставки, на это больше движок хранения влияет. Вставка из csv - это умеет оригинальный клиент КХ, в кластере будет КХ или нет уже не особо повлияет.
Обсуждают сегодня