184 похожих чатов

Добрый день или ночь )) вопрос по архитектуре - большая таблица,

рекламные события постоянно пишутся - (много и часто). группировка времени - час. думаю что-то в духе
summingmergetree(
dt datetime
client_id UInt32
остальные поля
)
ENGINE = SummingMergeTree
PARTITION BY toYYYYMMDD(dt)
PRIMARY KEY (dt, client_id)
ORDER BY (client_id,....dt)

Вроде как видел тут рекомендации утащить dt вконец списка order by если партиции по дате. Это так или я напутал?
Примари кей мне не особо нужен, но читал в доке что без него он будет равным ORDER BY - а там с десяток полей - они в примари точно не нужны. Не устарели данные?
Стоит ли добавить client_id в PARTITION BY toYYYYMMDD(dt? client_id).
Клиентов ну штук 1000 наверно. Или партиции лопнут от такого количества?
Стоит ли партировать по дню - в день 10-20 ярдов строк - или сразу по месяцу
Вот ))

4 ответов

10 просмотров

>Стоит ли добавить client_id в PARTITION BY toYYYYMMDD(dt? client_id). >Клиентов ну штук 1000 наверно. Или партиции лопнут от такого количества? лопнут >PRIMARY KEY (dt, client_id) >ORDER BY (client_id,....dt) так нельзя PRIMARY KEY это префикс, вам точно dt в индексе надо? вы будете фильтровать кверяя меньше суток? логично в индес все таки полезные поля положить, типа id баннера или криэтива или tag >Стоит ли партировать по дню - в день 10-20 ярдов строк - или сразу по месяцу неправильные критерии. Сколько лет вы собираетесь данные в этой таблице хранить? Надо кол-во партиций сделать небольшим. Плюс если вы данные будете кверять по диапазону месяц или год, то дневные партиции убьют перформанс, потому что надо будет ходить по индексам в куче партиций

VячеслаV-Владимиров Автор вопроса
Denny [Altinity]
>Стоит ли добавить client_id в PARTITION BY toYYYY...

"Хранить вечно" ну неск лет точно

VячеслаV-Владимиров Автор вопроса
Denny [Altinity]
>Стоит ли добавить client_id в PARTITION BY toYYYY...

дата нужна в order by, чтоб схлопывать данные,

VячеслаV Владимиров
"Хранить вечно" ну неск лет точно

значит partition by toYYYYMM(dt) PRIMARY KEY ( channel_id, что-то_блин_полезное, toStartOfHour(dt)) ORDER BY ( channel_id, что-то_блин_полезное, toStartOfHour(dt), мусор, dt) хотя если у вас dt уже округлен до часа то partition by toYYYYMM(dt) PRIMARY KEY ( channel_id, что-то_блин_полезное, toStartOfHour(dt)) ORDER BY ( channel_id, что-то_блин_полезное, toStartOfHour(dt), мусор)

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта