кодом 999. Самая первая и следующие за ними
Code: 999, e.displayText() = Coordination::Exception: Operation timeout (no response) for request List for path: <путь в зк> (Operation timeout)
Code: 999, e.displayText() = Coordination::Exception: <путь в зк> (Connection loss)
Code: 999, e.displayText() = Coordination::Exception: Session expired (Session expired)
вторая и третья ошибки повторялись для других таблиц, также падали ошибки с кодом 225 (DB::Exception: ZooKeeper session has been expired.) и с кодом 242 (DB::Exception: Table is in readonly mode)
эти все ошибки происходили в рамках одной секунды, потом КХ переподключился к ЗК и все стало хорошо, ошибки прекратились. Вопрос заключается в том, от чего это могло начаться? Что за Operation Timeout был в самой первой ошибке?
ЗК - кластер из 3 нод
ну смотрите логи ZK нод, у них там не было потери кворума случайно?
Обсуждают сегодня