Привет всем Подскажите, куда копать, что почитать. Задача - есть поток

событий в топике. Для некоторых записей надо вырезать или хешировать определенные поля (ну например номер телефона)
Как такое сделать с минимальными затратами?
В лоб видится приложение которое просто из одного топика читает -> вырезает нужное -> складывает в другой топик.
Но это сразу мониторнинг, алертинг, отказоусточивость и прочие радости. Может есть какой-нибудь более простой способ получить то же самое?

13 ответов

12 просмотров

Kafka streams выглядит как идеальный вариант для этой задачи Но все равно читать из одного топика и писать в другой, сложно иначе

Не понимаю конечной задачи

напоминает GDPR/CCPA/CPNI требования

Anton-Pilipenko Автор вопроса
Eugene Bosiakov
Не понимаю конечной задачи

ну частный случай деперсонализации потока событий

Arsen
напоминает GDPR/CCPA/CPNI требования

Какой же это гдпр, если топик с оригинальными данными остается, разве что на оригинале будет ретеншн до 14 дней

Anton Pilipenko
ну частный случай деперсонализации потока событий

А почему вообще нужно писать в кафку сначала персонализированные данные?

Anton-Pilipenko Автор вопроса
Eugene Bosiakov
А почему вообще нужно писать в кафку сначала персо...

потому что поток контролирую не я и он не только для меня.

Anton Pilipenko
потому что поток контролирую не я и он не только д...

А в чем вопрос тогда? Только преобразовывать данные и писать в новый топик

Anton-Pilipenko Автор вопроса
Eugene Bosiakov
А в чем вопрос тогда? Только преобразовывать данны...

ну может быть есть какие-то варианты типа подгрузить код на кластер или сделать что-то типа view для топика (ну это я фантазирую) потому я спросил Достать - изменить - положить тут то все ясно

Anton Pilipenko
ну может быть есть какие-то варианты типа подгрузи...

У кафки концепт в том, что данные лежат блоками друг за другом, чтобы Random io свести к минимуму

Anton Pilipenko
ну может быть есть какие-то варианты типа подгрузи...

желание понятно, но на кафку не ложится, только дублировать

Похожие вопросы

Обсуждают сегодня

Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
8
Я правильно понимаю что нет способов получить список ожидающих заявок на вступление в группу с помощью бота из mtproto?
Шамиль Прилов
8
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
🙋 Ребята, всем привет. Поправил задачу: Нужно каждому новому сообщению (1 раз по каждому юзеру) в чате прибавлять снизу кнопку с предложением подписаться на канал. Как добавит...
Alexander
1
Добрый день. Мне посоветовали обратиться к вам в чат за помощью. Ситуация описана на скрине. Как мне сказали, мне на бота навесили флудвейт. Есть ли возможность снять его ра...
OVERLINK
7
всем привет помогите пожалуйста используя CDN (GCP) у игроков из вьетнама загружается конфиг (размер 999 bytes) загружается 5 и более минут н а других CDN сервисах такой пробл...
Andrew Krw.
1
Просто по очереди выпиливаешь на ручной маппинг? По методу за раз
Andrii Kurdiumov
7
Приветствую. А не подскажете какие ограничения есть на использования api метода setMyName ? Несколько раз сменил имя бота и получил бан на 2 месяца на смену имени.
Slick Slack
8
Привет, коллеги! Возникла задача ограничить максимальный размер вложений для определённых расширений, например, чтобы для изображений лимит был 10 МБ, а для видео — 100 МБ. Ог...
Andro
1
Всем привет! Взялся портировать модули на 18 версию, лезет _logger.log(log_level, 'no translation language detected, skipping translation %s', frame, stack_info=True) А чт...
Max Lit
3
Карта сайта