184 похожих чатов

Привет! Имеется кластер Clickhouse с тремя шардами по две реплики

на каждом. При запросе к Distributed таблице первого шарда по query_log видно, что на второй шард запрос отправляется только на одну реплику, а на третий на обе. В итоге запрос на одной из реплик третего шарда падает с ошибкой Code: 210. DB::NetException: I/O error: Broken pipe, while writing to socket. Но в целом запрос корректно отрабатывает. Подскажите, это нормальное поведение? Либо что-то не то в настройках?

6 ответов

17 просмотров

да это нормальное поведение есть переменная connect_timeout_with_failover_ms https://clickhouse.com/docs/en/operations/settings/settings#connect-timeout-with-failover-ms посмотрите какое у вас выставлено значение, раньше она 100ms была. и если нет ответа на коннект к реплике. то спрашивается следующая живая в шарде, в итоге когда ответ появляется distributed клиент нода инициатор сокет со своей стороны закрыла и вы получаете broken pipe еще есть max_parallel_replicas https://clickhouse.com/docs/en/operations/settings/settings#max_parallel_replicas ее не рекомендуют с sub queries использовать...

Это делает hedged_request. Их можно отключит

Alex-Bezverkhikh Автор вопроса
Slach [altinity]
да это нормальное поведение есть переменная conn...

У нас connect_timeout_with_failover_ms = 1000, max_parallel_replicas = 1. Из порядка 600 тыс однотипных запросов в сутки только порядка 1000 с такой ошибкой. В этом случае что может является причиной запуска запроса на вторую реплику?

Alex Bezverkhikh
У нас connect_timeout_with_failover_ms = 1000, max...

ну вон вам там про hedged denny уже писал да может...

Alex-Bezverkhikh Автор вопроса
Slach [altinity]
ну вон вам там про hedged denny уже писал да може...

Да, use_hedged_requests = 1. Но почему одни запросы дублируются, а другие нет?

Alex Bezverkhikh
Да, use_hedged_requests = 1. Но почему одни запрос...

потому что в одних таймаут срабатывает в других нет

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта