туда вставляются данные.
Допустим таблица вида
PK( EventDate, ObjectID ), value1, value3, ..., valueN
Описывает состояние объектов в n-ное время.
99% времени - value1, value2, value3, ..., valueN не изменяются. Изменяется только EventDate, что в PK, это время "съёма" значений.
В целом, при хранении мне всё равно, пусть даже дублируются.
В результатах запросов - не нужны.
т.е. по факту, я хочу иметь историю изменения состояний и возможность выбрать только те, у кого состояния менялись за некоторый интервал времени, это будет 2-3 изменившихся значения.
GROUP BY по всем филдам мне не кажется хорошей идеей.
Использовать DISTINCT по value1, value2, value3, ..., valueN?
Завести филд для хеша всех value и делать по нему GROUP by hash?
Адаптироваться к CollapsingMergeTree?
А если поменять структуру таблицы, сделать не value1, value2,... valueN, а name и value, в первую колонку пишем название показателя, во вторую - значение.
наверно, добавлю hash столбцов в PK и ReplacingMergeTree сделаю
Обсуждают сегодня