у каждого параметра разный: INT32, FLOAT32, FLOAT64 и т.п., параметров ~50к)?
у вас 50к параметров за один раз передается? с какой частотой?
несколько пачек т.к. параметры передают данные с разной частотой, 1 раз в 30 секунд
CREATE TABLE iot_data ( date Date, time DateTime64(6), device_id LowCardinality(String), param_name LowCardinality(String), param_type LowCardinality(String), float32_value Float32 CODEC(DELTA), float64_value Float64 CODEC(DELTA), int32_value int32 CODEC(DELTA) ) ENGINE=MergeTree() ORDER BY (date, param_name, dt, device_id) PARTITION BY toYYYMM(date)
Спасибо! Еще вопрос, стоит ли Param_Name вынести в словарь и заменить id?
только если вы param_name со временем собираетесь менять и вам требуется при смене имени параметра сохранить приемственность данных за прошлые периоды
CODEC(DELTA) - LZ4 по умолчанию будет использоваться или его нужно явно указывать?
интересно, при большом кол-ве записей в таблице (несколько ТБ) каким будет влияние на хранение, от того что для каждого значения параметра используется столбец нужного типа (вопрос наверное больше к тому, сколько байт резервирует под неиспользуемые ячейки)
они не савсем неиспользуемые, там дефолтное значение будет 0 для типа не используйте Nullable вам оно не надо и поскольку у вас будет толпа одинаковых значений в колонке то дельта кодек как раз должен сильно помочь сжатию
допустимо дельту с LZ4 или ZSTD использовать?
Обсуждают сегодня