из-за того, что на нем оказалось больше всего партиций и второй день уже партиции не могут перенестись и макс лаг держится в районе 100 млн на каждой ноде.
Что можете посоветовать в этом случае?
Если несколько реплик и другие брокера менее загружены, то можете попробовать сместить лидеров на другие брокера. Если не изменяет память, новые реплики тянут данные с лидера
Есть какой-то штатный функционал?
Если никаких тулзов не используете, то kafka-reassign-partitions: в него нужно передать нужный конфиг (первая реплика в списке - имеет наибольший приоритет). Дальше запустить kafka-leader-election (или как-то типа kafka-prefered-partitions) с флагом preferred - это должно перекинуть лидеров на нужные (предпочтительные) брокера.
Лидер элекшен на сколько я помню при отставаниях лучше не запускать. В целом проблему свою поборол лимитами, вроде догоняются и как минимум половина партиций уже досинкались
Обсуждают сегодня