184 похожих чатов

Ребят, такой вопрос: расследую Exception: Cannot provide query execution status. The

query's node <path> has been deleted by the cleaner since it was finished (or its lifetime is expired).
ловится рандомно на дистрибьютед DDL (version 20.12.4.5)
в квэри-логе родительский запрос:
QueryStart - 2021-04-21 08:05:44.397523
ExceptionWhileProcessing - 2021-04-21 08:05:44.456042
т.е. получает эксепшен через 58 мс
* причем дочерний квэрик (типа /* ddl_entry=query-XX */ ...) пришел (из ЗК как понимаю) и выполнился без проблем на этой ноде и по остальным в кластере
** на ноде-инициаторе запроса - дочерний начался даже раньше чем получен эксепшен на родительский запрос
QueryStart = 2021-04-21 08:05:44.423589
QueryFinish = 2021-04-21 08:05:44.735141
=====
вопросы:
1 - может ли быть так что в ClickHouse/dbms/src/Interpreters/DDLWorker.cpp обращение if (!zookeeper->exists(node_path)) ждет, например, кворума или еще по какой-то причине не получает корректного ответа, при том что запрос который был сформирован из ЗК task_queue уже успел прийти и начать выполняться? Если да - есть советы по обходу?
2 - есть ли способ добавить запросу какую-нибудь задержку/возможность ре-трая параметрами при проверке статуса? (помню был параметр timeout_before_checking_execution_speed - может на ЗК водится что-нибудь подобное) ну или возможно набор сеттингов для ЗК с потенциально лагающей сетью?
3 - может ли засада таиться в том что разные процессы хэндлят и почему-то не договорились по нодам/локам/...?

15 ответов

14 просмотров
Piotr-Liakhavets Автор вопроса

UP @den_crane , @dj_mixer , может у Вас в карманах случайно магическая парамка завалялась?

хм, суть проблемы в чем? запрос выполнился вроде успешно - вы не хотите видеть ошибку на выполнении?

а что с ЗК? у вас случайно не обзервер используется?

Piotr-Liakhavets Автор вопроса
Piotr Liakhavets
да ложных эксепшенов избежать

у вас много ДДЛов создается/бегает?

Piotr-Liakhavets Автор вопроса
Denny [Altinity]
а что с ЗК? у вас случайно не обзервер используетс...

Не знаю что под "обзервером" понимаете, опсы ответили не, нет обезрверов у меня ЗК 5 нод на отдельных машинках * сеть - Hetzner (

Piotr-Liakhavets Автор вопроса
【D】【J】
у вас много ДДЛов создается/бегает?

дропы партишек от промежуточного тира ... ~ 20-60 запросов в час остальные ддл - стохастически и редко <1/час

Piotr Liakhavets
да ложных эксепшенов избежать

наверно просто баг в реализации (судя по коду) https://github.com/ClickHouse/ClickHouse/issues/19027 у вас есть на инициаторе какие-либо ещё ошибки либо в ЗК логе?

Mikhail Tiurin
Тебе прям все?

в личку пульнул чтоб чат не порочить

Piotr-Liakhavets Автор вопроса
【D】【J】
наверно просто баг в реализации (судя по коду) htt...

в зк эрроров не вижу (ток INFO/WARNING) на ноде тоже ничего подозрительного в этот диапазон времени

Piotr Liakhavets
в зк эрроров не вижу (ток INFO/WARNING) на ноде то...

такой инфолог есть? An error occurred while creating auxiliary ZooKeeper directories in

Mikhail Tiurin
нет

ну тогда это баг и надо в коде сильно копать, скорее всего связано с переделкой database=replicated, судя по времени всех багов... в гитхабе несколько тикетов, добавляйтесь в любой...

Похожие вопросы

Обсуждают сегодня

Типа вызывать GetParent и проверять на соответствие GetModuleHandle?
The Bird of Hermes
67
Do any of you guys have interesting projects one could join? I'm a Middle Full-Stack developer (JS/TS, React & Node)
Lev Shapiro
40
$res = json_decode($наша строка из респонса); $res1 = array_map(fn($o) => $o->name, $res->breadcrumbs[0]->entities); Как такое будет на Хаскеле?.. В начале весь джейсон, в ко...
Хаскель Моисеевич Гопник
27
В чем сила брат, в NASM или FASM?
Isaac Kleiner
18
Вопрос по диагностике ошибок (я знаю в чем, в данном конкретном примере, я знаю, как исправить, пример модельный, понятно, что в реальности бывает намного запутаннее). module...
ⰄⰎⰋⰐⰐⰑⰛⰤⰧⰧⰩⰄ ⰊⰑⰁⰓⰡⰛⰦⰕⰫ
10
Хтось використовував Vapor на Windows?
Jaroshevskii
15
Тут кста кто-нибудь NeoVim использует?
Simple Sorcerer
13
А чем вам питонисты не угодили?😂
.
79
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
52
у меня вопрос на счет .global <name> для чего это нужно если я пишу на ассемблере? только для того что бы сделать это видимым для линкера? вот что написано в докумментации GA...
Simple Sorcerer
1
Карта сайта