Нужно обработать "файл" с 350М записями/строками. Записал его в топик

с 64 партициями, встал на начало, запустил 24 консьюмера с одной consumer group. Прошло 5+ дней, в среднем обработал 70-80%, частью партиций догнала хвост (lag=0), но минорная часть косньюмеров полностью остановилась. Перезапускаешь консьюмер, он не потребляет.

Я правильно понимаю, что внутри ребаланса консьюмеров нет прямо идеальной логики, что кафка будет раскидывать только "необработанные" партиции и забивать на уже "обработанные" (lag=0)? В топик никто не пишет, это однократный статичный файл. То есть в конце, добавленный консьюмер с большой вероятностью назначается на обработанные партции? И только совсем в ручном режиме можно самому как-то раскидать остатки?

1 ответов

7 просмотров

Кафка же не знает пишет кто-то в топик или нет. Топик разбит на 64 партиции, которые распределяются по 24-м консьюмерам, скорее всего 16 коньсюмеров получают по 3 партиции и оставшиеся 8 по 2. Логично предположить что эти 8 консьюмеров и останавливаются. By default в кафке два варианта partition.assignment.strategy Range и RoundRobin. Ни в том ни в другом случае перезапуск консьюмера не поможет загрузить его «необработанными» партициями. При выключении консьюмера «обработанная» партиция уезжает к другому консьюмеру, но не нагружает его дополнительно, а при включении консьюмера партиция снова приезжает к нему, но обрабатывать там уже нечего и консьюмер продолжает стоять. Нужно было делать либо 48 партиций, либо 32 консьюмера для равномерности.

Похожие вопросы

Обсуждают сегодня

Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
с помощью чего можно бота добавить как админа в чат? (условно в боте есть кнопка, нажатие на которую приводит тебя к выбору чата и выдаче прав боту)
ηє νєямσяє
5
Ты просто гитлеровскую эстетику плохо понимаешь. Он же всё под Цезаря делал. А это как бы запрещённый приём в политике. Пиджаки они зачем все носят? Чтобы показать что они тип...
Ivan Kropotkin
4
'frakturBold' => ['𝖆', '𝖇', '𝖈', '𝖉', '𝖊', '𝖋', '𝖌', '𝖍', '𝖎', '𝖏', '𝖐', '𝖑', '𝖒', '𝖓', '𝖔', '𝖕', '𝖖', '𝖗', '𝖘', '𝖙', '𝖚', '𝖛', '𝖜', '𝖝', '𝖞', '𝖟', '𝕬', '𝕭', '𝕮', '𝕯'...
Roma
4
Добрый день, не подскажите, если в OC-V3 поменять страндартную директорию /storage/ на /storage2/ - не будет сильно много проблем ?
Max Dubovsky
32
Добрый день, подскажите как правильно сделать filter в backend-e. Есть модель (товар) у который связь belongsToMany (компания), компаний > 4k, поэтому выборку типа ->all(); н...
Max Dubovsky
7
А цены чем оправданы?
Lencore
7
напомните, как заменить placeholder , а не добавить содержимое ?
Artem N
4
Каким то образом можно определить ширину экрана пользователя перед загрузкой partial-а? Надо рассчитать ширину кадров слайдера для ресайза картинок для container-fluid.
Point 111
22
Всем привет. Нужна платная консультация от тех, кто сталкивался с октябрём в кластере или шарит оч хорошо в цмс. Проблема следующая: после переноса в кластер октябрь начал ...
wl
8
Карта сайта