ch, сейчас использую jdbc, движек таблиц mergtree, возникают разные интересные артефакты при загрузке. Необходимо грузить 5 млрд строк, 200 гб в паркете, за раз. Что для этого сейчас модно использовать ?
Непонятно, что за артефакты. но есть небольшой набор ссылок по поводу ClickHouse + Spark (https://kb.altinity.com/altinity-kb-integrations/spark/)
У mergetree можно включать дедупликацию вставки и реьтраить инсерты
Обсуждают сегодня