184 похожих чатов

Коллеги, подскажите, пожалуйста: 1) Есть исходный MV с данными вида entity_id, ts

(время получения данных), data_* (много разных полей int/string)

данные постоянно докидываются и образуются дубли по entity_id

для работы необходима только последняя версия данных для каждого entity_id.


2) Для получения последней версии данных делаю MV AggregatingMergeTree таким запросом:

CREATE MATERIALIZED VIEW test_amt
ENGINE = AggregatingMergeTree()
PARTITION BY tuple() ORDER BY (entity_id)
AS
SELECT
argMaxState(id, ts) AS id,
entity_id,
argMaxState(data_version, ts) AS data_version,
{еще примерно 10 полей через argMaxState},
minState(ts) AS min_ts,
maxState(ts) AS max_ts
FROM test
GROUP BY entity_id

3) вставляю исторические данные в amt (insert into select ... from)

4) Поверх делаю вьюху

CREATE VIEW test_view
AS
select
argMaxMerge(id) as id,
entity_id,
argMaxMerge(tracker_sid) as tracker_sid,
argMaxMerge(action) as action,
argMaxMerge(data_version) as data_version,
{еще примерно 10 полей через argMaxState},
argMaxMerge(ts_action) as ts_action,
minMerge(min_ts) as min_ts_captured,
maxMerge(max_ts) as max_ts_captured
from test_amt
group by entity_id

5) Вижу, что данные схлопнулись:

select count() from test
140466
15ms

select count() from test_view
125970
65ms

6) Проблема в том, что при запросах к test_view с указанием фильтрации хотя бы по одному полю скорость выборки значительно падает, до 300-400ms.
Пример запроса (в результатах выборки ~350 строк):
SELECT data_job_id,
data_city_id,
data_job_type,
data_state_id,
data_private,
data_archived,
data_created_at
FROM
test_view
WHERE
tracker_sid = 'test_42055b08-25cf-4e89-aa86-0eedd36a4e17'

376ms

--
Вопрос такой - как можно улучшить быстродействие, на что обратить внимание? Количество записей очень мало, а скорость кажется совершенно неприемлемой.

2 ответов

13 просмотров

какая версия КХ? Что будет если WHERE tracker_sid заменить на PREWHERE WHERE tracker_sid = чему равно SELECT * FROM system.settings WHERE name LIKE '%predicat%'

ааа, ясно, argMaxMerge(tracker_sid) as tracker_sid т.е. для этой вью надо всю таблицу прочитать, сгруппировать и потом уже фильтровать. Естественно медленно.

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
7
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Всем привет! вывожу на общей стр дочерние ресурсыв каждом ресурсе галерея, и первая фотка должна выводиться на общей [!DocLister? &prepare=photo !]
Alekso
12
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
7
А можно вопрос? Мне сегодня сказали что у меня функция (которая просто заполняет массив значениями) не правильная void Full(double * arr, int n) { for (int i = 0; i < n; i...
† C E †
7
Добрый вечер. Хочу чтобы у меня в классе поле было функцией, которая возвращает строку. Делаю так: interface ... TGetOutPath = function : String of object; ... protec...
Kirill Filippenok
12
Карта сайта