184 похожих чатов

Привет. Есть кластер КХ, 11 серверов, версия 23.4.2.11. Читаем данные

из 20 топиков кафки, везде конфиг подключения к кафке одинаковый, но с двумя топиками есть проблема: идет постоянная перевычитка из кафки, в таблицу ложатся дубли (х10, х20, больше), но консюмер лаг по консюмер группе клика не падает, а просто всегда равен текущему кол-ву сообщений в топике. В логах клика примерно раз в 5-10 минут видим сообщения "[rdk:SESSTMOUT] [thrd:main] Consumer group session timed out (in join-state steady) after 10296 ms without a successfull response from the group coordinator (broker: 2, last error was Broker: Group rebalance in progress): revoking assignment and rejoining group". То есть общий механизм перевычитки понятен - консюмер КХ не может закоммитить вычитанное из-за таймаута, постоянно переподключается, перевычитывает, опять отваливается, и т. д.
Вопрос же у меня такой: а почему это может происходить только с двумя топиками, но не с остальными 18-ю?? Остальные топики имеют и большее, и меньшее количество партиций, права на сбойные топики абсолютно такие же. Ошибки о таймауте для каждого сбойного топика идут от разных брокеров. По другим топикам (среди них есть и значительно более нагруженные) таких проблем нет. Почему? Как починить, или хотя бы куда посмотреть? Спасибо.

2 ответов

21 просмотр

например может быть что-то такое, но найти причину может быть не просто - жирные сообщения которые долго процессятся, может json большой парсите - много мат вью на 1 топике, долго вставка проходит во все таблицы - джойны в матвью, долго вставка проходит во все таблицы - каскадные матвью, какая-то вьюшка падает в конце с ошибкой и не даёт закомитать

> Если есть свежая проблема с тысячным счетчиком Это что-то новое?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта