Ребят, всем привет! Подскажите пожалуйста концептаульно про отправку батчами. У меня есть

большой лист json'ов:
list_of_msgs = [{msg1}, {msg2}, {msg3}...{msgN}]


я создаю продюсера (питон, библиотека kafka-python. чем будут читать - не знаю)
producerobj = KafkaProducer()


далее я итерируюсь по листу и отправляю каждое сообщение, делая flush раз в сто сообщений

counter = 0
for msg in list_of_msgs:
producerobj.send(msg)
counter += 1
if counter % 100 = 0:
producerobj.flush()


Так работает очень долго.
Кажется, можно отправлять в кафку батчами, по крайней мере есть такой параметр у продюсера.

Но я не очень понимаю как организовать это, получается просто без цикла положить весь лист в отправку, а кафка под капотом будет отправлять сообщения в зависимости от наполненности и разобъет сообщение на батчи, как я установил в настройках продьюсера?
типа вот так и все:

Вариант 1:
producerobj.send(list_of_msgs)


Но как тогда делать flush раз в сто сообщений?
Или мне нужно самостоятельно написать как итерироваться по списку, и отправлять по сто сообщений, например:

Вариант 2:
for i in range(0, len(list_of_msgs), 100):
producerobj.send(list_of_msgs[i: i+100])
producerobj.flush()


Вопросы:
* Какой вариант лучше 1 или 2
* Верно ли я понимаю, что я могу в send положить список сообщений, а не сообщение, и тогда кафка под капотом будет отправлять этот список по кусочкам, в зависимости от установленного размера батча?

2 ответов

30 просмотров

зависит от клиентской библиотеки, конечно, но как правило вы устанавливаете размеры пакетов батчей, и клиент сам под капотом отправляет батч каждый раз, когда набирает сообщения. за это могут отвечать и flush_interval, и минимальный размер батча, и максимальный размер батча. ответы на вопросы: * чаще всего достаточно 1 варианта, обычно клиентские библиотеки сами за вас будут отправлять батчи. если вы хотите удостовериться, что после пачки сообщений все были точно отправлены - можете дергать вручную. * правильно, с условием, если клиентская библиотека имеет соответствующий функционал.

Vitalik- Автор вопроса
George Bolshakov
зависит от клиентской библиотеки, конечно, но как ...

Спасибо большое! Библиотека kafka-python, в ней у продюсера есть настройки batch_size и linger_ms, я так понимаю, первый параметр отвечает за размер батча, второй за время (что кажется бессмысленно, в моем случае, если отправить в send лист) Попробую вариант 1

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Привет!) Кто как юзает переменные в строках?) Чисто ради интереса Вот так: echo "У меня {$bananasAmount} бананов"; Или вот так: echo "У меня ${bananasAmount} бананов";
Виталий
3
разработчик ботов скидывает портфолио, боты которые он уже создал. А вот как узнать что это именно он их создал?
Gosudar
4
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
кто-нибудь уже пробовал это?
Lencore
4
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
❓ Подскажите как сделать в группе телеги функцию (кнопку) пересылки сообщения где есть нарушение правил? Бот к каждому сообщению (по определенным ключам) добавляет снизу кнопк...
Alexander
4
Карта сайта