Кажется, достаточно простой вопрос для знающих Есть кафка топик, в которую

внешняя команду пишет данные. Из этого топика читает batch spark джоба данные, трансформирует и кладет его в хранилище.
Иногда бывает так, что ребята на внешней стороне поошибке/невнимательности/плавающему багу пишут белеберду в message. Из-за этого, собственно, батч джоба благополучно падает. Но мы точно знаем, что offsets с x + n невалидные, т.е. мы их можем просто скипнуть без угрызения совести.

Текущий способ решения этой проблемы:
- Поскольку в kakfa-chechpoints offset проставляется значением из последней успешной батч джобой, то нужно взять код батчджобы и законментировать всю бизнес логику, тогда - все мессажди будут просто прочитаны из топика, без каких либо обработок. Джоба успешно завершится, и чекпоинт обновится - прописав последний оффсет из топика. Таким образом невалидные сообщения в топике будут скипнуты.
Проблемы текущего способа решения очевидны.

Как можно решить такую ситуацию более разумно, и по феншую?

P.S. Разумеется, кафка кластер менеджится отдельной командой, и быстро/пожеланию параметры кафки не поменять. Если надо менять - то нужно проходить кучи согласований и т.д.

2 ответов

26 просмотров

Кастомный десериализатор сообщений? Успех - обработали, нет - пропустили. Как я понял, ситуация с невалидными сообщениями может возникать снова и снова, поэтому, на мой взгляд, разумно это в процессинге и предусмотреть

Almaz-Murzabekov Автор вопроса
Nikita Ryanov
Кастомный десериализатор сообщений? Успех - обрабо...

Кстати, тоже к этой мысли подходил. Все невалидные/нераспаршенные месседжи класть в отдельную карантинную таблицу, потом мониторить что в этой таблице. Спасибо за идею!)

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта