получении налету усредненных данных за 4, 15, 60 секунд. Нашел в документации, что задача решается при помощи мат вью и дополнительных таблиц. Проэкспериментировал, Мат вью + MergeTree решают задачу, в графане графики одинаковые при выборке данных из оригинальной таблицы с аггрегацией налету и при выборе данных из аггрегированной таблицы
Вью выглядит так:
CREATE MATERIALIZED VIEW graphite_mv_avg15 TO graphite_avg15 AS
SELECT
Path,
avg(Value) AS Value,
Date,
Time,
toStartOfInterval(toDateTime(Timestamp), toIntervalSecond(15)) AS Timestamp
FROM carbon_metrics.graphite
GROUP BY (Path, Date, Time, Timestamp)
Таблица с аггрегированным представлением:
CREATE TABLE graphite_avg15
(
Path LowCardinality(String) CODEC(ZSTD),
Value Float64 CODEC(ZSTD),
Time UInt32 CODEC(Delta, LZ4),
Date Date CODEC(ZSTD),
Timestamp UInt32 CODEC(Delta, LZ4)
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(Date)
ORDER BY (Path, Time)
SETTINGS index_granularity = '8192'
Вопрос актуален в том плане, что если AggregatingMergeTree не нужен, то аггрегированные таблицы можно будет сделать на базе ReplicatedMergeTree.
Что я упускаю?
Summing и Aggregating домерживают схлапывают в бекграцнде. Мат. Вью это не делает потому что это триггер на инсерт и не читает исходную таблицу
К сожалению, не совсем понимаю, что из этого следует: аггрегации во вью без использования AggregatingMergeTree/SummingMergeTree будут работать на очень коротком интервале последних данных, которые прилетели одним батчем на инсерт?
https://den-crane.github.io/Everything_you_should_know_about_materialized_views_commented.pdf https://youtu.be/1LVJ_WcLgF8?list=PLO3lfQbpDVI-hyw4MyqxEk3rDHw95SzxJ&t=7597
Обсуждают сегодня