184 похожих чатов

React — русскоговорящее с...

Android Developers

Vue.js — русскоговорящее ...

Telegram Developers

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Angular - русскоговорящее...

Верстка сайтов HTML/CSS/J...

Kubernetes — русскоговоря...

Битрикс для разработчиков

MODX. Русскоязычное сообщ...

pgsql – PostgreSQL

iOS Developers — русского...

ClickHouse не тормозит

Rust — русскоговорящее со...

JavaScript — русскоговоря...

React Native — русскогово...

Docker — русскоговорящее ...

HTML/CSS — русскоговоряще...

Python beginners

🐧 RU.UBUNTU — Официальное...

Kotlin Community

Чат экстремального погром...

Scala User Group

Клуб Vue.js-разработчиков

Xamarin Developers (MAUI,...

Svelte [svelt] - All abou...

Системное администрирован...

Nuxt.js | Vue SSR

var chat = new Chat();

Data Science Chat

Ассемблер

Android Architecture

Laravel для начинающих

Церковь метрик

QA — русскоговорящее сооб...

DBA - русскоговорящее соо...

PostgreSQL + 1C + Linux

R (язык программирования)

MongoDB Russian

Yandex Cloud - Официальны...

Big Data Science :: AI / ...

Delphi & Lazarus

Solidity Development

Evolution CMS официальное...

pro.net (former COM+)

OpenStreetMap RU

Visual Studio Code — русс...

GraphQL — русскоговорящее...

IDE и редакторы — русског...

OpenCartForum - 🇺🇦🇪🇺Чат O...

Angular.js (1.x) — русско...

Flutter Developers — русс...

AI / Искусственный Интелл...

Laravel Framework Russian...

Чат — Верстка Сайтов и Фр...

Java Underground

Natural Language Processi...

SqlCom.ru - сообщество MS...

Delphi Community

Server Side Swift Develop...

Autohotkey_RU ( v1 & v2 )

PHP DevConf KZ🇰🇿

pro.rb (Ruby/Rails / RU)

Odoo talks & fun

Software Design/Architect...

AndroidDev Pro:: Професси...

WordPress for developers

PowerShellRus - о Powersh...

Эльбрусы и с чем их едят

Java/Kotlin and more

pro.buildsystems

React: русскоязычное сооб...

Python для анализа данных

Скрипты Гугл, Таблицы, Go...

Compiler Development

firebase_ru — русскоговор...

RU.CRYPTOGRAPHY — Криптог...

pro.osdev - os developmen...

Это RabbitMQ

GameDev for Web

PostgreSQL (English)

Tilda Developers

RU.Docker — Официальное Р...

Emacs — русскоговорящее с...

FreePascal & Lazarus

Язык программирования Jul...

WordPress – русскоговорящ...

ReasonML и OCaml

WebAssembly — русскоговор...

ansible — русскоговорящее...

Сrystal Lang — русскогово...

Clojure — русскоговорящее...

macOS Developers — русско...

use Perl or die;

FORTH и родственные ЯП

Natural Language Processi...

DevSecOps - русскоговорящ...

Sequelize - community (en...

Elm Lang сообщество разра...

WordPress CodeRun

ReactiveX - русскоговорящ...

PureScript — русскоговоря...

Эликсир и Вунш

ClickHouse не тормозит

Коллеги, кликауз тормозит, при моём первом подходе к задаче. У

меня есть выборка (ключ, начало периода, конец_периода) через subquery, и как натравить это на большую таблицу с фактами, чтобы выбрались нужные записи? Пока что получается только полный скан большой таблицы, т.к where работает после join

#backend #clickhouse #database #devops #programming #russian

0

03.05.2023

37 ответов

43 просмотра

Konstantin Ilchenko

а что за запрос, почему нельзя where до join?

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
а что за запрос, почему нельзя where до join?

потому что там в where есть >= на даты, а они не умеют быть в ON

0

03.05.2023

Slach [altinity]

смотрите сторону engine=Join и joinGet https://clickhouse.com/docs/en/engines/table-engines/special/join#creating-a-table либо в сторону словарей SOURCE(CLICKHOUSE(query ...) LAYOUT range_hashed(...) и dictGet https://clickhouse.com/docs/en/sql-reference/dictionaries#range_hashed

0

03.05.2023

Konstantin Ilchenko

Zorro Zorroff
потому что там в where есть >= на даты, а они не у...

может вам вместо джойна нужен range словарь? https://clickhouse.com/docs/en/sql-reference/dictionaries#range_hashed и что без join тоже фулскан по ключам сортировки? и как вообще понять проблему если запрос не показываете)

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
может вам вместо джойна нужен range словарь? https...

table facts (ts datetime64, key, value) primary key(ts, key) -- large table table facts_1m (ts datetime64, key, value) primary key(ts, key) -- aggregated by 1 minute. в facts_1m лежат sum(value) поминутно по ключам, например. они считаются на кроне, рандомно, на каждый ключ, версией 1 агрегации. Не вдаемся в проблемы почему так, т.к. тут я упрощаю. запрос with last_available as (select key, max(ts) maxts, max(ts)+interval 1 day maxtsneed from facts_1m group by key), -- найти последние вставленные, но не хотеть слишком много ибо ОЗУ на 1 запрос. insquery as (select toMinute(ts) tm, key, sum(value) value -- агрегация from facts f outer join last_available la on f.key=la.key -- прикрутить по ключу and f.ts>la.maxts and f.ts < la.maxtsneed group by key, tm), -- ограничить по диапазону insert into facts_1m select * from insquery -- вставить пропущенное запрос синтаксически не выдержан, но в принципе похож

0

03.05.2023

Konstantin Ilchenko

Zorro Zorroff
table facts (ts datetime64, key, value) primary ke...

первым делом я бы менял ключ сортировки в обоих таблицах на (key, ts), group by ускорится многократно а дальше уже думать над джойн

0

03.05.2023

Zorro Zorroff Автор вопроса

Zorro Zorroff
table facts (ts datetime64, key, value) primary ke...

версия 1 аггрегации - был предыдущий job который запускался в произвольное время и делал агрегацию по каждому ключу от последнего раза до текущего момента. Таким образом разные ключи агрегированы последний раз в разное время. Я пишу новый job (вторая версия) и хочу одним инсертом вставить всё незааггрегированное по каждому ключу)

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
первым делом я бы менял ключ сортировки в обоих та...

там так и есть в базе. Я был неточен и по памяти упрощал.

0

03.05.2023

Konstantin Ilchenko

Zorro Zorroff
версия 1 аггрегации - был предыдущий job который з...

ну это хороший вариант, просто выбирать промежуток времени и вставлять всё, без проверок на каждый ключ

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
ну это хороший вариант, просто выбирать промежуток...

это да, но на текущий момент там рандомные окончания по разным ключам.

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
ну это хороший вариант, просто выбирать промежуток...

к тому же задача может появляться в подобной формулировке и в других разрезах

0

03.05.2023

Konstantin Ilchenko

Zorro Zorroff
к тому же задача может появляться в подобной форму...

если ключей много и не влазят в память и нужны джойны, мы решаем разбитием на батчи например, циклом key % 10 = 0/1/2/3... в случаях когда памяти хватает но нужна скорость юзаем engine = Join ну и в свежих версиях можно попробовать поиграть с настройкой join_algorithm, иногда очень сильно ускоряет запросы

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
если ключей много и не влазят в память и нужны джо...

ключей мало. Проблемы с тем, что по ощущению оно не использует индекс чтобы шариться в конце таблицы фактов, а сканирует ее всю.

0

03.05.2023

Zorro Zorroff Автор вопроса

Zorro Zorroff
ключей мало. Проблемы с тем, что по ощущению оно н...

это не ощущение, а цифры во время select, там progress размером со всю таблицу facts

0

03.05.2023

Konstantin Ilchenko

Zorro Zorroff
ключей мало. Проблемы с тем, что по ощущению оно н...

ну можно через where in попробовать отфильровать например, WHERE (key, toStartOfMinute(ts)) IN (сгенерировать поминутный range от max до max + 1 day). Будет ли разница

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
ну можно через where in попробовать отфильровать н...

оно не треснет там внутри? а как генерировать range, а как их склеивать?

0

03.05.2023

Konstantin Ilchenko

Zorro Zorroff
оно не треснет там внутри? а как генерировать rang...

ну если ключей немного, то не должно треснуть для теста можно попробовать FROM facts WHERE (key, toStartOfMinute(ts)) IN (SELECT key, arrayJoin(timeSlots(max(ts), toUInt32(60 * 60 * 24), 60)) minute from facts_1m GROUP BY key)

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
ну если ключей немного, то не должно треснуть для ...

спасибо, щас проверим

0

03.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
ну если ключей немного, то не должно треснуть для ...

даже работает! спасибо, в этом смысле - ускорил запрос!

0

04.05.2023

Konstantin Ilchenko

Zorro Zorroff
даже работает! спасибо, в этом смысле - ускорил за...

ради интереса, в процентах какая разница?

0

04.05.2023

Zorro Zorroff Автор вопроса

щас скажу.

0

04.05.2023

Zorro Zorroff Автор вопроса

Zorro Zorroff
щас скажу.

у меня предыдущие запросы (часть селекта), генерирующие интервалы, занимают ок 20 секунд. После этого я генерирую arrayJoin, и потом прямой запрос из таблицы с фактами. Там дырка где-то 5 минут должна вернуться. Если я запрашиваю с запасом в сутки вперед и выходит большой arrayJoin, то весь запрос работает 45 секунд. Если я запрашиваю с запасом в час вперед, то работает 27 секунд. В обоих случаях возвращает около 500000 записей из таблицы (фактов) для последующей агрегации. Если старую версию брать, то уходило на десяток минут плюс по ощущениям, я ни разу не дождался, если честно. Время указано на испольнение целиком всего запроса с with...

0

04.05.2023

Konstantin Ilchenko

Zorro Zorroff
у меня предыдущие запросы (часть селекта), генерир...

норм) рабочая техника

0

04.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
норм) рабочая техника

теперь если бы еще оптимизировать select key, max(ts) group by key с учетом того что все индексы есть, чтобы не сканировало целиком, было бы совсем улёт 8)

0

04.05.2023

Konstantin Ilchenko

Zorro Zorroff
теперь если бы еще оптимизировать select key, max(...

так оно бы не работало так быстро, если бы индекс не юзался, покажите полный запрос и статистику по нему

0

04.05.2023

Denny [Altinity]

Zorro Zorroff
теперь если бы еще оптимизировать select key, max(...

Вроде уже обсуждали что order by limit по индексу пойдет. Ну или projection

0

04.05.2023

Zorro Zorroff Автор вопроса

Denny [Altinity]
Вроде уже обсуждали что order by limit по индексу ...

да, но там ЕМНИП было для 1 ключа а тут для всех.

0

04.05.2023

Zorro Zorroff Автор вопроса

Zorro Zorroff
да, но там ЕМНИП было для 1 ключа а тут для всех.

там была фишка с max_block_size, что полезно.

0

04.05.2023

Denny [Altinity]

Zorro Zorroff
там была фишка с max_block_size, что полезно.

Ну можно проекцию сделать где будет max уже посчитан

0

04.05.2023

Zorro Zorroff Автор вопроса

Denny [Altinity]
Ну можно проекцию сделать где будет max уже посчит...

я туплю, я не понимаю о чем речь.

0

04.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
так оно бы не работало так быстро, если бы индекс ...

статистику как именно смотреть?*

0

04.05.2023

Denny [Altinity]

Zorro Zorroff
я туплю, я не понимаю о чем речь.

https://kb.altinity.com/altinity-kb-queries-and-syntax/projections-examples/

0

04.05.2023

Zorro Zorroff Автор вопроса

Denny [Altinity]
https://kb.altinity.com/altinity-kb-queries-and-sy...

господи боже, а я не в курсе

0

04.05.2023

Denny [Altinity]

Zorro Zorroff
господи боже, а я не в курсе

Там внизу ссылки на видео и доки

0

04.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
так оно бы не работало так быстро, если бы индекс ...

так, добавил проекции, поиграл блоком, 9 секунд на часовой интервал, щас интервал еще сделаю динамическим... как смотреть статистику-то?

0

04.05.2023

Konstantin Ilchenko

Zorro Zorroff
так, добавил проекции, поиграл блоком, 9 секунд на...

по хорошему set send_logs_level = 'trace' и дальше запрос выполнить и смотреть логи, максимально подробный вариант

0

04.05.2023

Zorro Zorroff Автор вопроса

Konstantin Ilchenko
по хорошему set send_logs_level = 'trace' и дальш...

вот на третьем (?) году пользования кликхаузом узнал. Это о чем говорит? Это говорит что все три года всё было и так очень отлично!

0

04.05.2023

Похожие вопросы

ClickHouse не тормозит / unhingedlunatic

Подписаться

Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...

#backend #clickhouse #database #devops #programming #russian

12.11.2023

0

42 ответов

ClickHouse не тормозит / Maria Besedina

Подписаться

Доброе утро, коллеги! Может вы что-то подскажите по следующей ситуации. Загружаем словари в витрины в CH по следующему алгоритму: - создали 2 таблицы с одинаковой структурой: ...

#backend #clickhouse #database #devops #programming #russian

27.10.2023

0

27 ответов

ClickHouse не тормозит / 为什么要翻译 .

Подписаться

Всем привет, обновил clickhouse на локальном компьютере, теперь он не поднимается, валится с ошибкой: 2023.11.15 10:53:11.735595 [ 8069 ] {} <Error> Application: Code: 48. DB...

#backend #clickhouse #database #devops #programming #russian

15.11.2023

0

17 ответов

ClickHouse не тормозит / Алексей Чернов

Подписаться

Всем привет. В настоящее время в Клике происходит рассинхрон данных между таблицей и её проекцией, из-за чего запрос может вернуть одну и ту же строку с разными данными в зави...

#backend #clickhouse #database #devops #programming #russian

05.09.2023

0

2 ответов

ClickHouse не тормозит / Sergey Fedyanov

Подписаться

Добрый днь! Конфигурация: - k8s - ClickHouse Operator 0.12.0 provided by Altinity - ClickHouse server version 22.11.6 revision 54460. В манифесте: kind: "ClickHouseInstallati...

#backend #clickhouse #database #devops #programming #russian

06.09.2023

0

3 ответов

ClickHouse не тормозит / Sergey Smirnov

Подписаться

SSIS выгрузка из Clickhouse данных типа string. Висит на стороне SSIS. Вижу с помощью Wireshark, что Clickhouse отдает все правильно. SSIS висит на обработке столбца типа DT_T...

#backend #clickhouse #database #devops #programming #russian

14.06.2023

0

45 ответов

ClickHouse не тормозит / Clir

Подписаться

Добрый день. Много раз уже обсуждали проблему No active replica has part и зависшие парты в replication_queue. Всегда предлагаете решение detach+attach+system restart replica ...

#backend #clickhouse #database #devops #programming #russian

06.11.2023

0

28 ответов

ClickHouse не тормозит / Igor Gorbenko

Подписаться

Всем привет! Столкнулись с такой проблемой, связанной с чтением данных из S3. Мы читаем данные из parquet файлов, используя табличный движок S3 и вставляем в целевую таблицу д...

#backend #clickhouse #database #devops #programming #russian

22.08.2023

0

1 ответов

ClickHouse не тормозит / Асель Магжанова

Подписаться

Всем привет! помогите, пожалуйста, разобраться с проблемой: внеапно в логах появились ошибки вида: 0. DB::Exception::Exception(DB::Exception::MessageMasked&&, int, bool) @ 0xd...

#backend #clickhouse #database #devops #programming #russian

04.10.2023

0

7 ответов

ClickHouse не тормозит / Stas Dombrovskyi

Подписаться

Всем привет. Кто-то использует вот такой бутстрап схем/таблиц в кликхаус в кубере? https://github.com/Altinity/clickhouse-operator/blob/master/docs/chi-examples/02-templates-0...

#backend #clickhouse #database #devops #programming #russian

03.11.2023

0

22 ответов

Смотреть еще

ClickHouse не тормозит

Подписаться

Вопросов 34756

Ответов 72457

Участников 8768

Telegram @clickhouse_ru

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?

Rꙮman Yankꙮvsky

А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...

30500 за редактор? )

Владимир

а через ESC-код ?

Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится

У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...

Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...

Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...

Ребят в СИ можно реализовать ООП?

https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...

Карта сайта