Ребят, подскажите пожалуйста первый раз работаю с кафкой. Задача отправлять в

нее элементы pandas df, в avro формате

Вопросы:
1) если честно по запросам "pandas df to kafka" нахожу только спарковский df. вообще пандасовские фреймы можно отправлять?
2) в какой момент строка преобразуется в авро? Мне для этого нужно самому отдельную функцию писать, или оно под капотом?
Просто видел примеры, когда в кафку отправляют строки из csv, и никаких функций преобразований в авро сообщение я не заметил (хотя может плохо искал)

Спасибо!

7 ответов

15 просмотров

В кафке все данные представлены массивом байт, поэтому надо думать как представить ваши данные в сериализованном виде, а авро это примерно как типизированный бинарный json

Vitalik- Автор вопроса
Max xbim
В кафке все данные представлены массивом байт, поэ...

Спасибо! Пока кроме итерирования по строкам фрейма, создания из каждой строки авро строки, ну и видимо, последующего перевода в байты ничего не приходит в голову. Я в эту сторону думаю, или глупость?)

Vitalik
Спасибо! Пока кроме итерирования по строкам фрейма...

Предположу что в чат единицы знают что такое пандас дф, может есть примеры?

Vitalik- Автор вопроса
Max xbim
Предположу что в чат единицы знают что такое панда...

Pandas.DataFrame Объект из питоновской библиотеки для работы с данными. По сути это таблица. Думаю, питонисты все знают его

Max xbim
Предположу что в чат единицы знают что такое панда...

Это датафреймы питоновские, двумерные массивы. Отправил в личку статью по Avro и Python

Дима Ларин
Это датафреймы питоновские, двумерные массивы. Отп...

Ну вот сериализуете по статье и кладёте сообщение в кафку 👍

привет. Мне кажется можешь использовать ETL инструмент Apache NiFi Датафрейм преобразовать в джсон и кидать в NiFi У найфая есть конвертеры встроенные, джсон в Авро, и есть встроенный процессор паблишТуКафка. Ну это так, из вариантов)

Похожие вопросы

Обсуждают сегодня

Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
40 тысяч в час / 3600 = 11,11 в секунду... Вам точно нужна очередь? (я просто не знаю "контекста") Такое количество запросов любое приложение замечательно "прожует" и не попер...
Igor Mitin
5
Всем салют, заинтересовался odoo, хотел бы поинтересоваться на счёт этой ERP , прогеры которые работают над проектами вы используете odoo как серверную платформу работая с RES...
⚔️
8
А как асинхрон иначе реализован? Пардон:)
Ivan K 🏄🏻‍♂️
7
вопрос: кто как решает вопрос с динамической подгрузкой скриптов для отдельных страниц с включенным turbo router?
Sergei Toroptsev
25
Сonst magicTgHTML = (text, entities) => { let processedText = text; let offsetShift = 0; entities.forEach(entity => { const { offset, length, type, url, ...
Андрей
1
Друзья, за кем?
Magic
12
Почему Telegram пишет, что объект media не найден, хотя на самом деле я его передаю? Делаю на urllib, без зависимостей, так надо. Вызываю метод sendMediaGroup с таким JSON: ...
Alexey S
1
Это что теперь, любой бот сможет принимать платежи без ебли с юр лицами?
Lencore
8
ого, спасибо Никит, ты как всегда кладезь нужной инфы! Сейчас пойду копаться, а мне релиз создать как и версию самого плагина? типа 1.0.8?
Alex Blaze
9
Карта сайта