лежат в кластере CH  возвращать в CH.  Новую порцию лить в свежую таблицу и подменивать партицию в исходной.  Планирую использовать Apache Spark для расчетов .    * нет никаких идей как это лучше приготовить?)
                  
                  
                
Делали так раньше. Запускали на airflow pyspark. В clickhouse можно использовать ReplacingMergeTree если подходит
Обсуждают сегодня