184 похожих чатов

Ребят, такой вопрос: расследую Exception: Cannot provide query execution status. The

query's node <path> has been deleted by the cleaner since it was finished (or its lifetime is expired).
ловится рандомно на дистрибьютед DDL (version 20.12.4.5)
в квэри-логе родительский запрос:
QueryStart - 2021-04-21 08:05:44.397523
ExceptionWhileProcessing - 2021-04-21 08:05:44.456042
т.е. получает эксепшен через 58 мс
* причем дочерний квэрик (типа /* ddl_entry=query-XX */ ...) пришел (из ЗК как понимаю) и выполнился без проблем на этой ноде и по остальным в кластере
** на ноде-инициаторе запроса - дочерний начался даже раньше чем получен эксепшен на родительский запрос
QueryStart = 2021-04-21 08:05:44.423589
QueryFinish = 2021-04-21 08:05:44.735141
=====
вопросы:
1 - может ли быть так что в ClickHouse/dbms/src/Interpreters/DDLWorker.cpp обращение if (!zookeeper->exists(node_path)) ждет, например, кворума или еще по какой-то причине не получает корректного ответа, при том что запрос который был сформирован из ЗК task_queue уже успел прийти и начать выполняться? Если да - есть советы по обходу?
2 - есть ли способ добавить запросу какую-нибудь задержку/возможность ре-трая параметрами при проверке статуса? (помню был параметр timeout_before_checking_execution_speed - может на ЗК водится что-нибудь подобное) ну или возможно набор сеттингов для ЗК с потенциально лагающей сетью?
3 - может ли засада таиться в том что разные процессы хэндлят и почему-то не договорились по нодам/локам/...?

15 ответов

23 просмотра
Piotr-Liakhavets Автор вопроса

UP @den_crane , @dj_mixer , может у Вас в карманах случайно магическая парамка завалялась?

хм, суть проблемы в чем? запрос выполнился вроде успешно - вы не хотите видеть ошибку на выполнении?

а что с ЗК? у вас случайно не обзервер используется?

Piotr-Liakhavets Автор вопроса
Piotr Liakhavets
да ложных эксепшенов избежать

у вас много ДДЛов создается/бегает?

Piotr-Liakhavets Автор вопроса
Denny [Altinity]
а что с ЗК? у вас случайно не обзервер используетс...

Не знаю что под "обзервером" понимаете, опсы ответили не, нет обезрверов у меня ЗК 5 нод на отдельных машинках * сеть - Hetzner (

Piotr-Liakhavets Автор вопроса
【D】【J】
у вас много ДДЛов создается/бегает?

дропы партишек от промежуточного тира ... ~ 20-60 запросов в час остальные ддл - стохастически и редко <1/час

Piotr Liakhavets
да ложных эксепшенов избежать

наверно просто баг в реализации (судя по коду) https://github.com/ClickHouse/ClickHouse/issues/19027 у вас есть на инициаторе какие-либо ещё ошибки либо в ЗК логе?

Mikhail Tiurin
Тебе прям все?

в личку пульнул чтоб чат не порочить

Piotr-Liakhavets Автор вопроса
【D】【J】
наверно просто баг в реализации (судя по коду) htt...

в зк эрроров не вижу (ток INFO/WARNING) на ноде тоже ничего подозрительного в этот диапазон времени

Piotr Liakhavets
в зк эрроров не вижу (ток INFO/WARNING) на ноде то...

такой инфолог есть? An error occurred while creating auxiliary ZooKeeper directories in

Mikhail Tiurin
нет

ну тогда это баг и надо в коде сильно копать, скорее всего связано с переделкой database=replicated, судя по времени всех багов... в гитхабе несколько тикетов, добавляйтесь в любой...

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта