184 похожих чатов

React — русскоговорящее с...

Android Developers

Vue.js — русскоговорящее ...

Telegram Developers

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Angular - русскоговорящее...

Верстка сайтов HTML/CSS/J...

Kubernetes — русскоговоря...

Битрикс для разработчиков

MODX. Русскоязычное сообщ...

pgsql – PostgreSQL

iOS Developers — русского...

ClickHouse не тормозит

Rust — русскоговорящее со...

JavaScript — русскоговоря...

React Native — русскогово...

Docker — русскоговорящее ...

HTML/CSS — русскоговоряще...

Python beginners

🐧 RU.UBUNTU — Официальное...

Kotlin Community

Чат экстремального погром...

Scala User Group

Клуб Vue.js-разработчиков

Xamarin Developers (MAUI,...

Svelte [svelt] - All abou...

Системное администрирован...

Nuxt.js | Vue SSR

var chat = new Chat();

Data Science Chat

Ассемблер

Android Architecture

Laravel для начинающих

Церковь метрик

QA — русскоговорящее сооб...

DBA - русскоговорящее соо...

PostgreSQL + 1C + Linux

R (язык программирования)

MongoDB Russian

Yandex Cloud - Официальны...

Big Data Science :: AI / ...

Delphi & Lazarus

Solidity Development

Evolution CMS официальное...

pro.net (former COM+)

OpenStreetMap RU

Visual Studio Code — русс...

GraphQL — русскоговорящее...

IDE и редакторы — русског...

OpenCartForum - 🇺🇦🇪🇺Чат O...

Angular.js (1.x) — русско...

Flutter Developers — русс...

AI / Искусственный Интелл...

Laravel Framework Russian...

Чат — Верстка Сайтов и Фр...

Java Underground

Natural Language Processi...

SqlCom.ru - сообщество MS...

Delphi Community

Server Side Swift Develop...

Autohotkey_RU ( v1 & v2 )

PHP DevConf KZ🇰🇿

pro.rb (Ruby/Rails / RU)

Odoo talks & fun

Software Design/Architect...

AndroidDev Pro:: Професси...

WordPress for developers

PowerShellRus - о Powersh...

Эльбрусы и с чем их едят

Java/Kotlin and more

pro.buildsystems

React: русскоязычное сооб...

Python для анализа данных

Скрипты Гугл, Таблицы, Go...

Compiler Development

firebase_ru — русскоговор...

RU.CRYPTOGRAPHY — Криптог...

pro.osdev - os developmen...

Это RabbitMQ

GameDev for Web

PostgreSQL (English)

Tilda Developers

RU.Docker — Официальное Р...

Emacs — русскоговорящее с...

FreePascal & Lazarus

Язык программирования Jul...

WordPress – русскоговорящ...

ReasonML и OCaml

WebAssembly — русскоговор...

ansible — русскоговорящее...

Сrystal Lang — русскогово...

Clojure — русскоговорящее...

macOS Developers — русско...

use Perl or die;

FORTH и родственные ЯП

Natural Language Processi...

DevSecOps - русскоговорящ...

Sequelize - community (en...

Elm Lang сообщество разра...

WordPress CodeRun

ReactiveX - русскоговорящ...

PureScript — русскоговоря...

Эликсир и Вунш

ClickHouse не тормозит

Alexander Malyuzhenets

Недавно обновились до версии 23.7.4.5, до этого сидели на версии

22.10? (не помню точно).
И появилась такая проблема - заливаем данные батчом через distributed таблицу на одной из нод кластера в data таблицы кластера. Данные оперативно передаются на принимающую ноду за 20 минут со скоростью под 10Гбит/с в 200 потоков, а далее начинают распределяться по нодам кластера в data таблицы. Раньше этот процесс распределения занимал около 1-1.5 часов, а после обновления вырос до 7.5-8 часов.
Предполагаю что появился какой-то лимит/настройка, только знать бы какой. Как можно в такой конфигурации ускорить процесс передачи данных по кластеру? Лить данные напрямую в data таблицы пока не планировали, в целом устраивает простота загрузки для etl процесса.

#backend #clickhouse #database #devops #programming #russian

0

31.08.2023

29 ответов

73 просмотра

Slach [altinity]

https://clickhouse.com/docs/en/operations/server-configuration-parameters/settings#background_distributed_schedule_pool_size background_distributed_schedule_pool_size: 256 попробуйте поставить в настройках сервера в config.d

0

31.08.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
https://clickhouse.com/docs/en/operations/server-c...

Спасибо, попробуем. Также думаю включить отправку файлов батчами (distributed_directory_monitor_batch_inserts) и понаблюдаю за файлами на отправку в директории /var/lib/clickhouse/data/database/table/

0

31.08.2023

Slach [altinity]

Alexander Malyuzhenets
Спасибо, попробуем. Также думаю включить отправку ...

там метрики есть в system.metircs кол-во не отправленных distibuted файлов

0

31.08.2023

Alexander Malyuzhenets Автор вопроса

подняли background_distributed_schedule_pool_size, но возможно он уперся в background_pool_size и его также нужно поднять. Но проблема в чем-то еще - число BackgroundDistributedSchedulePoolTask при загрузке данных не растет, и даже упало с 3 до 1, а при этом DistributedFilesToInsert выросло значительно. Что может мешать поднимать дополнительные фоновые задачи на раздачу данных по кластеру? metric |value | -------------------------------------|------------| BackgroundDistributedSchedulePoolTask| 1| BackgroundDistributedSchedulePoolSize| 16| DistributedSend | 1| StorageDistributedThreads | 0| StorageDistributedThreadsActive | 0| DistributedInsertThreads | 0| DistributedInsertThreadsActive | 0| DistributedBytesToInsert |167842821978| BrokenDistributedBytesToInsert | 0| DistributedFilesToInsert | 39563| BrokenDistributedFilesToInsert | 0|

0

01.09.2023

Slach [altinity]

Alexander Malyuzhenets
подняли background_distributed_schedule_pool_size,...

логи смотрите...

0

01.09.2023

Slach [altinity]

Alexander Malyuzhenets
подняли background_distributed_schedule_pool_size,...

SYSTEM START DISTIRBUTED SENDS может остановил кто что...

0

01.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
логи смотрите...

Напишу здесь результаты postmortem, возможно кому-то пригодится ) Процессы-писатели отдавали на принимающую ноду с distributed таблицей порядка 150Гб данных, по времени загрузка шла около 20 минут. Далее distributed таблица раскидывала данные по нодам кластера, включая эту же ноду. Вылетало 2 вида ошибок - wait timeout в 120с для процесса-писателя и too many parts на конечных дата нодах. Полечили повышением таймаута для писателей (подняли до 600 секунд), явным включением async_insert по дата нодам и повышением лимитов по буферу для асинхронной вставки - время ожидания подняли до 60 секунд и размер поставили с запасом в 500Мб. В общем что-то поменялось в версиях клика в 2023 году, и пришлось повозиться с настройками чтобы процессы загрузки отрабатывали как прежде... name |value | -----------------------------|---------| async_insert_deduplicate |1 | async_insert |1 | wait_for_async_insert |1 | wait_for_async_insert_timeout|600 | async_insert_max_data_size |500000000| async_insert_busy_timeout_ms |60000 |

0

06.09.2023

Slach [altinity]

too many parts, на 23.x надо еще умудриться схватить... там костылей вагон для того чтобы это хендлить правильно может оно у вас там именно вставка стала другой? размер батча на вставку банально снизился? а вы clickhouse бросились тюнить... system.part_log есть ? смотрите целевую таблицу на rows и event_type='NewPart' до апдейта и после апдейта...

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
too many parts, на 23.x надо еще умудриться схвати...

размер исходного батча на вставку был 500К записей, сейчас подняли до 1М в system.part_log для целевой таблицы картина до и после обновления не сильно поменялась - в среднем по 1500 строк на парт, порядка 1.5М записей с типом NewPart до обновления и стало 0.5М-1М записей после обновления (тут сложно вычленять упавшие по внешнему таймауту загрузки)

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
размер исходного батча на вставку был 500К записей...

эти 500 к сплитуются по шардам... и в итоговую таблицу будет меньше размер чанка

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
размер исходного батча на вставку был 500К записей...

1500 строк на парт, не вяжется с 500к записей на один инсерт в initiator node

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
эти 500 к сплитуются по шардам... и в итоговую таб...

я привел статистику для MergeTree таблицы на одной дата ноде

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
размер исходного батча на вставку был 500К записей...

и надо смотреть не среднее. а quantiles(0.5,0.9)(rows)

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
1500 строк на парт, не вяжется с 500к записей на о...

согласен, но ведь Distributed каким-то образом делает распределение данных по кластеру на основе функции шардирования

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
согласен, но ведь Distributed каким-то образом дел...

ну так если на вход distributed 500к строк... за ОДИН INSERT (размер батча) и у вас допустим 5 шардов... то это никак не может быть тогда в целевой ноде всего 1500 строк на новый парт...

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
и надо смотреть не среднее. а quantiles(0.5,0.9)(r...

квантили такие:1000 - 2500 были

0

06.09.2023

Slach [altinity]

сколько шардов? если 5 шардов. то значит вставляете не по 500к а по 50k на порядок меньше...

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

4 шарда

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
сколько шардов? если 5 шардов. то значит вставляе...

в моем понимании distributed движок кэширует входящие данные во временные файлы (DistributedFilesToInsert) и затем из них формирует новые батчи для отправки на шарды, при этом данные группирует согласно функции шардирования

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
4 шарда

значит вставляете от 4000 до 10000 в один INSERT SELECT event_date, hostName() h, quantiles(0.5,0.9)(writen_rows) FROM clusterAllReplicas('cluster_name',system.query_log) WHERE is_initial_query AND has(tables,'db.distributed_table') AND event_type='QueryFinish' GROUP BY event_date, h ORDER BY h, event_date written_rows смотрите

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
в моем понимании distributed движок кэширует входя...

нет, это не кеширование это сплитование по функции шардирования сразу во время вставки. в .bin файлы формата Native с раскладкой по каталогам и в дальнейшем обычный INSERT INTO ... FORMAT Native на целевой шард, в зависимости от internal_replication на одну реплику или на несколько...

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
значит вставляете от 4000 до 10000 в один INSERT S...

честно показывает 500К и 500К записей до обновления, и после обновления стало так: [0.0,500000.0] [0.0,2000000.0] 2млн - видимо там коллега поставил 2 а не 1млн

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
нет, это не кеширование это сплитование по функци...

репликации у нас нет а какой объем он передает на шард? сразу 1 файл отдает или дробит на батчи?

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
честно показывает 500К и 500К записей до обновлени...

откуда 0.0 на 50% персентиле? https://fiddle.clickhouse.com/e800e37a-2afc-46b5-97ed-3625b724ea3f WHERE event_type='QueryFinish' забыли?

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
репликации у нас нет а какой объем он передает на ...

один файл .bin за один INSERT на целевой шард... но если вы 2 000 000 строк вставляете ... то это по 500 000 строк в одном .bin файле должно быть... а не по 1500 ... где то у вас что-то не сходится...

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
откуда 0.0 на 50% персентиле? https://fiddle.click...

type='QueryFinish' не забыл, в логе и правда много записей с written_rows=0 возможно это упавшие передачи, которые в итоге ничего не записали?

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
type='QueryFinish' не забыл, в логе и правда много...

оно тогда не может быть is_initial_query и QueryFinish если written_rows =0 то что упало оно с другим статусом завершается... ну то есть у вас клиент мог недождаться ответа и отключиться... но тогда все равно ошибка при попытке записать в клиентский сокет результат ответа... и статус не QueryFinish покажите пример из лога с SELECT * FROM system.query_log WHERE ... AND written_rows=0 AND event_date=today() LIMIT 1 FORMAT Vertical

0

06.09.2023

Alexander Malyuzhenets Автор вопроса

Slach [altinity]
оно тогда не может быть is_initial_query и QueryFi...

нужно было еще условие добавить and query_kind='Insert'

0

06.09.2023

Slach [altinity]

Alexander Malyuzhenets
нужно было еще условие добавить and query_kind='I...

а да, забыл... ну и что с персентилями стало?

0

06.09.2023

Похожие вопросы

ClickHouse не тормозит / unhingedlunatic

Подписаться

Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...

#backend #clickhouse #database #devops #programming #russian

12.11.2023

0

42 ответов

ClickHouse не тормозит / Maria Besedina

Подписаться

Доброе утро, коллеги! Может вы что-то подскажите по следующей ситуации. Загружаем словари в витрины в CH по следующему алгоритму: - создали 2 таблицы с одинаковой структурой: ...

#backend #clickhouse #database #devops #programming #russian

27.10.2023

0

27 ответов

ClickHouse не тормозит / 为什么要翻译 .

Подписаться

Всем привет, обновил clickhouse на локальном компьютере, теперь он не поднимается, валится с ошибкой: 2023.11.15 10:53:11.735595 [ 8069 ] {} <Error> Application: Code: 48. DB...

#backend #clickhouse #database #devops #programming #russian

15.11.2023

0

17 ответов

ClickHouse не тормозит / Алексей Чернов

Подписаться

Всем привет. В настоящее время в Клике происходит рассинхрон данных между таблицей и её проекцией, из-за чего запрос может вернуть одну и ту же строку с разными данными в зави...

#backend #clickhouse #database #devops #programming #russian

05.09.2023

0

2 ответов

ClickHouse не тормозит / Sergey Fedyanov

Подписаться

Добрый днь! Конфигурация: - k8s - ClickHouse Operator 0.12.0 provided by Altinity - ClickHouse server version 22.11.6 revision 54460. В манифесте: kind: "ClickHouseInstallati...

#backend #clickhouse #database #devops #programming #russian

06.09.2023

0

3 ответов

ClickHouse не тормозит / Sergey Smirnov

Подписаться

SSIS выгрузка из Clickhouse данных типа string. Висит на стороне SSIS. Вижу с помощью Wireshark, что Clickhouse отдает все правильно. SSIS висит на обработке столбца типа DT_T...

#backend #clickhouse #database #devops #programming #russian

14.06.2023

0

45 ответов

ClickHouse не тормозит / Clir

Подписаться

Добрый день. Много раз уже обсуждали проблему No active replica has part и зависшие парты в replication_queue. Всегда предлагаете решение detach+attach+system restart replica ...

#backend #clickhouse #database #devops #programming #russian

06.11.2023

0

28 ответов

ClickHouse не тормозит / Igor Gorbenko

Подписаться

Всем привет! Столкнулись с такой проблемой, связанной с чтением данных из S3. Мы читаем данные из parquet файлов, используя табличный движок S3 и вставляем в целевую таблицу д...

#backend #clickhouse #database #devops #programming #russian

22.08.2023

0

1 ответов

ClickHouse не тормозит / Асель Магжанова

Подписаться

Всем привет! помогите, пожалуйста, разобраться с проблемой: внеапно в логах появились ошибки вида: 0. DB::Exception::Exception(DB::Exception::MessageMasked&&, int, bool) @ 0xd...

#backend #clickhouse #database #devops #programming #russian

04.10.2023

0

7 ответов

ClickHouse не тормозит / Stas Dombrovskyi

Подписаться

Всем привет. Кто-то использует вот такой бутстрап схем/таблиц в кликхаус в кубере? https://github.com/Altinity/clickhouse-operator/blob/master/docs/chi-examples/02-templates-0...

#backend #clickhouse #database #devops #programming #russian

03.11.2023

0

22 ответов

Смотреть еще

ClickHouse не тормозит

Подписаться

Вопросов 34756

Ответов 72457

Участников 8768

Telegram @clickhouse_ru

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?

Rꙮman Yankꙮvsky

А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...

30500 за редактор? )

Владимир

а через ESC-код ?

Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится

У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...

Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...

Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...

Ребят в СИ можно реализовать ООП?

https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...

Карта сайта