184 похожих чатов

Добрый всем. Подскажите по AggregatingMergeTree. Есть таблица AggregatingMergeTree, всего с одной AggregateFunction(uniq,

Int64)
и Order by по 13 полям.
Есть MV для этой таблицы.
Все как рекомендуется.

И тут есть 2 вопроса/непонятки:
1. В таблице всего 16 млн строк, при этом она занимает 20 гигов. сжатия почти нет. Причем в таблице нет каких-то больших текстов, 10 полей вообще числа до 10.
2. При выборке из таблицы размером в 20 гигов, падает в MEMORY_LIMIT 56 ГБ..
Делается агрегация по полям и uniqMerge()

Вся эта конструкция как раз и задумывалась чтобы избежать падения запроса по памяти, т.к. таблица источник более 10 млрд строк и 700 Гб...

Куда копать?

7 ответов

9 просмотров

ну во первых смотрите размер по колонкам, чтобы понимать что конкретно занимает место, пример запроса https://pastila.nl/?0317470c/852ea9995e9355d0fe24ce1bde7090fd#yLJ4Wzvfyjdfnn6lclL+Fg== во вторых как хранить state от uniq? это просто какие хешированные значения от исходных, чтобы потом можно былол смержить состояния, поэтому сжатия там не ожидайте Пробуйте менее точные функции, например uniqHLL, он должен места меньше занимать

Максим-Калягин Автор вопроса
Konstantin Ilchenko
ну во первых смотрите размер по колонкам, чтобы по...

Тогда очень сомнительная вообще выгода от использования такого подхода AggregatingMergeTree -State -Merge Уменьшило ли количетсво строчек? - да, а толку... запрос все равно не выполняется )))

Максим Калягин
Тогда очень сомнительная вообще выгода от использо...

ну, я бы не называл AggregatingMergeTree сомнительным "вообще" только из-за того, что вы туда положили non-additive метрику, как uniq, и движку приходится все уникальные значения хранить )

Максим Калягин
Тогда очень сомнительная вообще выгода от использо...

ну магии не существует) или терять в точности или больше памяти) в других базах в основном используется HLL, попробуйте его

а можете полностью показать как создана вьюха?

Максим-Калягин Автор вопроса
Tetra
а можете полностью показать как создана вьюха?

create materialized view table_mv to table_agg as select . . . . . . uniqState(cm.client_mapping_key) as cnt_client_mapping_key FROM source_table cm group by . . . . . . ;

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта