туда вставляются данные.
                  
                  
                  Допустим таблица вида 
                  
                  
                  PK( EventDate, ObjectID ), value1, value3, ..., valueN
                  
                  
                  Описывает состояние объектов в n-ное время.
                  
                  
                  99% времени - value1, value2, value3, ..., valueN не изменяются. Изменяется только EventDate, что в PK, это время "съёма" значений.
                  
                  
                  
                  
                  
                  В целом, при хранении мне всё равно, пусть даже дублируются.
                  
                  
                  В результатах запросов - не нужны.
                  
                  
                  
                  
                  
                  т.е. по факту, я хочу иметь историю изменения состояний и возможность выбрать только те, у кого состояния менялись за некоторый интервал времени, это будет 2-3 изменившихся значения.
                  
                  
                  GROUP BY по всем филдам мне не кажется хорошей идеей.
                  
                  
                  
                  
                  
                  Использовать DISTINCT по value1, value2, value3, ..., valueN?
                  
                  
                  Завести филд для хеша всех value и делать по нему GROUP by hash?
                  
                  
                  Адаптироваться к CollapsingMergeTree?
                  
                  
                
А если поменять структуру таблицы, сделать не value1, value2,... valueN, а name и value, в первую колонку пишем название показателя, во вторую - значение.
наверно, добавлю hash столбцов в PK и ReplacingMergeTree сделаю
Обсуждают сегодня