Ребят, всем привет! Подскажите пожалуйста концептаульно про отправку батчами. У меня есть

большой лист json'ов:
list_of_msgs = [{msg1}, {msg2}, {msg3}...{msgN}]


я создаю продюсера (питон, библиотека kafka-python. чем будут читать - не знаю)
producerobj = KafkaProducer()


далее я итерируюсь по листу и отправляю каждое сообщение, делая flush раз в сто сообщений

counter = 0
for msg in list_of_msgs:
producerobj.send(msg)
counter += 1
if counter % 100 = 0:
producerobj.flush()


Так работает очень долго.
Кажется, можно отправлять в кафку батчами, по крайней мере есть такой параметр у продюсера.

Но я не очень понимаю как организовать это, получается просто без цикла положить весь лист в отправку, а кафка под капотом будет отправлять сообщения в зависимости от наполненности и разобъет сообщение на батчи, как я установил в настройках продьюсера?
типа вот так и все:

Вариант 1:
producerobj.send(list_of_msgs)


Но как тогда делать flush раз в сто сообщений?
Или мне нужно самостоятельно написать как итерироваться по списку, и отправлять по сто сообщений, например:

Вариант 2:
for i in range(0, len(list_of_msgs), 100):
producerobj.send(list_of_msgs[i: i+100])
producerobj.flush()


Вопросы:
* Какой вариант лучше 1 или 2
* Верно ли я понимаю, что я могу в send положить список сообщений, а не сообщение, и тогда кафка под капотом будет отправлять этот список по кусочкам, в зависимости от установленного размера батча?

2 ответов

32 просмотра

зависит от клиентской библиотеки, конечно, но как правило вы устанавливаете размеры пакетов батчей, и клиент сам под капотом отправляет батч каждый раз, когда набирает сообщения. за это могут отвечать и flush_interval, и минимальный размер батча, и максимальный размер батча. ответы на вопросы: * чаще всего достаточно 1 варианта, обычно клиентские библиотеки сами за вас будут отправлять батчи. если вы хотите удостовериться, что после пачки сообщений все были точно отправлены - можете дергать вручную. * правильно, с условием, если клиентская библиотека имеет соответствующий функционал.

Vitalik- Автор вопроса
George Bolshakov
зависит от клиентской библиотеки, конечно, но как ...

Спасибо большое! Библиотека kafka-python, в ней у продюсера есть настройки batch_size и linger_ms, я так понимаю, первый параметр отвечает за размер батча, второй за время (что кажется бессмысленно, в моем случае, если отправить в send лист) Попробую вариант 1

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта