лежат в кластере CH возвращать в CH. Новую порцию лить в свежую таблицу и подменивать партицию в исходной. Планирую использовать Apache Spark для расчетов . * нет никаких идей как это лучше приготовить?)
Делали так раньше. Запускали на airflow pyspark. В clickhouse можно использовать ReplacingMergeTree если подходит
Обсуждают сегодня