таблицу при инсертах в source таблицу без потери консистентности? Или тормозить вставки, собирать агрегат и запускать вставки?
она итак консистентность там будет аггрегат в AggregatingMergeTree не финализирован, там только State необходимый для финальной аггрегации доку еще раз перечитайте, пожалуйста https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/aggregatingmergetree/#example-of-an-aggregated-materialized-view
как оно будет консистентным, если MV-триггер на инсерт. Пример, создана MV, далее я беру и заполняю таблицу, которая находится в TO без фильтров на то, что уже попало в TO. Разве суммы/количества не задвоятся?
а зачем так делать? заполняйте только таблицу которая в FROM для MV написана... а destination таблицу которая в TO пусть заполняет триггер MV
мне надо исторические данные же сохранить, MV начнет писать только новые, а мне старые тоже нужно пересобрать в агрегат.
исторические данные у вас сейчас в каком движке? MergeTree? или уже в AggregatingMergeTree?
они в source таблице, MergeTree.
в общем в любом случае, если нужна историчность, на ходу это безопасно не сделать, только останавливать заливку в source
у вас должно быть поле по которому четко можно определить "вот новые данные" назовем его import_counter в лучшем случае монотонно восрастающий snowflake id UInt64 в худшем случае datetime64(6) как DEFAULT now() который означает время импорта в source таблицу дальше делаете так создаете AggregatingMergeTree - aggregateed_table SELECT max(import_counter) FROM source_table сохраняем импортируем source таблицу по частям если большая INSERT INTO aggregated_table SELECT .. FROM source_table WHERE import_counter BETWEEN ... AND ... GROUP BY ... создаем новую таблицу с той же структурой что текущая CREATE new_source_table LIKE source_table создаем MaterializedView CREATE MATERIALZIED VIEW mv TO aggregated_table SELECT ... State(x) FROM new_source_table GROUP BY ... переключаем вставку на new_source_table довставляем дельту INSERT INTO aggregated_table SELECT .. FROM source_table WHERE import_counter > max_counter_from_previous_step GROUP BY ...
Да, спасибо, по такому алгоритму уже и делали, просто и вопрос заключался в том, чтобы не переключать вставку совсем. Такое в текущей реализации, к сожалению, не получится. Будем останавливать.
можно настроить КХ и создать MV таким образом чтобы при повторных вставках (ретраях инсертов) все довставлялось в MV (по умолчанию это выключено и я уже устал объяснять почему)
конечно сделать, без остановки можно, миллион способов
Обсуждают сегодня