Спасибо что спросил :) В общих словах это что-то типа

event sourcing (read model) - KStream (S1) -> groupByKey -> aggregate -> join back with S1, на выходе пишу в отдельный топик новые эвенты на основе накопленных данных.

По бизнес флоу получается что у меня есть много короткоживущих сущностей (около минуты) и очень мало долгоживущих (около часа).
В итоге получается где-то 100-200 новых сущностей в минуту. У всех обязательно есть конечный эвент после которого по этом ключу больше не будет новых эвентов.
Накопленное состояние чищу через tombstone, пока сущность жива меня интересует только последнее накопленное состояние.

Главный вопрос - хочу настроить адекватный компакшен для этого сценария (чтоб кафка брокер не насиловать, и чтоб было приемлемое время восстановления kafka streams приложения в худшем случае когда есть потеря локальных файлов RocksDB), что-то подсказывает что мне нужно рассчитать возможный размер состояния одной сущности, перемножить и прикинуть segment.bytes, segment.ms, min.cleanable.dirty.ratio.

Бонусный вопрос (сам еще не исследовал) - я заметил что в changelog topic пишутся сообщения с одним и тем же состоянием (т.к. некоторые исходные эвенты я просто не использую в агрегации), есть ли какой-то способ фильтр сделать или типа flatMap версию для aggregate, чтоб не писать лишнее в changelog topic?
Как это часто бывает пока писал бонусный вопрос - примерно понял как это можно сделать перед тем как запускать агрегацию, но кода будет явно больше чем если б я мог куда-то воткнуть условие по которому бы определялось надо ли писать сообщение в ченжлог топик или нет

1 ответов

21 просмотр

Погляди как тут написано - вроде похоже на твою задачу и не требует особого тюнинга брокера https://cwiki.apache.org/confluence/display/KAFKA/Kafka+Stream+Usage+Patterns#KafkaStreamUsagePatterns-Howtomanagethesizeofstatestoresusingtombstones?

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта