"а как бы нам файло через кафку пересылать и чтобы там такого оттьюнить, чтобы работало хорошо?"
Короткий ответ - лучше не надо. но если все таки очень хочется, то читаем дальше.
Для начала, самое более простое решение которое приходит в голову - это класть файлы в распределенное файловое хранилище (S3, NFS и прочее). этот поход зовётся claim-check pattern. Azure Event Hub - это сильно урезанная Кафка и "подтьюнить" там мало чего у вас получится.
Затем смотрим слайды Becket Qin из Линкеина
Он разбирает практически все возможные ситуации передачи файлов через Кафку. В самом начале он говорит почемуClaim-Check (он это называет reference-based messaging)для них не заработал и как они использовали chunking and reassembling. Для этого они даже пропатчили стандартную клиентскую библиотеку.
А как вы решаете подобную задачу?
Приходите и расскажите у нас в чатеt.me/proKafka
значит не я один такой. всем хочется пропихивать через кафку много странного
Спасибо!
Мы решаем именно claim-check. В легаси с nfs и celery, в новой платформе Google cloud storage + kafka.
Обсуждают сегодня