Нужно обработать "файл" с 350М записями/строками. Записал его в топик

с 64 партициями, встал на начало, запустил 24 консьюмера с одной consumer group. Прошло 5+ дней, в среднем обработал 70-80%, частью партиций догнала хвост (lag=0), но минорная часть косньюмеров полностью остановилась. Перезапускаешь консьюмер, он не потребляет.

Я правильно понимаю, что внутри ребаланса консьюмеров нет прямо идеальной логики, что кафка будет раскидывать только "необработанные" партиции и забивать на уже "обработанные" (lag=0)? В топик никто не пишет, это однократный статичный файл. То есть в конце, добавленный консьюмер с большой вероятностью назначается на обработанные партции? И только совсем в ручном режиме можно самому как-то раскидать остатки?

1 ответов

12 просмотров

Кафка же не знает пишет кто-то в топик или нет. Топик разбит на 64 партиции, которые распределяются по 24-м консьюмерам, скорее всего 16 коньсюмеров получают по 3 партиции и оставшиеся 8 по 2. Логично предположить что эти 8 консьюмеров и останавливаются. By default в кафке два варианта partition.assignment.strategy Range и RoundRobin. Ни в том ни в другом случае перезапуск консьюмера не поможет загрузить его «необработанными» партициями. При выключении консьюмера «обработанная» партиция уезжает к другому консьюмеру, но не нагружает его дополнительно, а при включении консьюмера партиция снова приезжает к нему, но обрабатывать там уже нечего и консьюмер продолжает стоять. Нужно было делать либо 48 партиций, либо 32 консьюмера для равномерности.

Похожие вопросы

Обсуждают сегодня

Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
12
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
9
🙋 Ребята, всем привет. Поправил задачу: Нужно каждому новому сообщению (1 раз по каждому юзеру) в чате прибавлять снизу кнопку с предложением подписаться на канал. Как добавит...
Alexander
1
Добрый день. Мне посоветовали обратиться к вам в чат за помощью. Ситуация описана на скрине. Как мне сказали, мне на бота навесили флудвейт. Есть ли возможность снять его ра...
OVERLINK
7
всем привет помогите пожалуйста используя CDN (GCP) у игроков из вьетнама загружается конфиг (размер 999 bytes) загружается 5 и более минут н а других CDN сервисах такой пробл...
Andrew Krw.
1
Просто по очереди выпиливаешь на ручной маппинг? По методу за раз
Andrii Kurdiumov
7
Вопрос: Здравствуйте! У меня возникла проблема с использованием плагина Mall в OctoberCMS. Я использую все файлы и компоненты в их исходном виде, без изменений. Однако на стр...
𐩱𐩪𐩣𐩱𐩲𐩺𐩡
2
Приветствую. А не подскажете какие ограничения есть на использования api метода setMyName ? Несколько раз сменил имя бота и получил бан на 2 месяца на смену имени.
Slick Slack
8
Привет, коллеги! Возникла задача ограничить максимальный размер вложений для определённых расширений, например, чтобы для изображений лимит был 10 МБ, а для видео — 100 МБ. Ог...
Andro
1
Карта сайта