взаимодействию с registry.
Вводные:
У меня есть два типа сообщений со своей avro схемой для каждого типа.
Просто строки json'ов
Я сериализую каждое сообщение своим типом схемы, и отправляю в кафку.
Они должны отправляться в один топик (это обязательно).
Для этого топика я могу curl'ом создать схему в двух версиях (в каждой версии будет своя схема для каждого типа сообщений), получить в ответ их айдишники этих схем в registry.
Имею условный код:
avro_schema_1 = 'some json string for schema 1'
avro_schema_2 = 'some json string for schema 2'
msg_type_1_list = [some list for 1 type msgs]
msg_type_2_list = [some list for 2 type msgs]
avro_schema_1_registry_id = 1001
avro_schema_1_registry_id = 1002
for msg in msg_type_1_list:
serialized_msg = serialize(msg, avro_schema_1)
producer.send(serialized_msg, *в моем понимании здесь нужно передать либо схему, либо айдишник в реджистри, т.к. продюсер при отправке получает просто байты, он не знает какой версией схемы я сериализовал сообщение. но ни у продюсера, ни у метода сенд я не нашел такого параметра*)
for msg in msg_type_2_list:
serialized_msg = serialize(msg, avro_schema_2)
producer.send(serialized_msg, ...)
Вопрос:
Как мне вместе с сообщением отправить айдишник схемы?
Либо как-то по-другому связать отправленное сообщение с номером версии схемы в registry.
Чтобы кафка, ну, вернее, консьюмер знал, какой схемой сообщение десереализовыать?
Использую либу kafka-python
Спасибо!
Конфлюэнтовские либы это решают добавлением ид схемы в само сообщение. Можете перейти на них, это будет стандартное решение, про которое все знают. Если хотите как-то сами - можно тоже в сообщение, или в хедеры. Главное, чтобы все ваши приложения знали, как с этим работать.
confluent_kafka имеете в виду? Подскажите тогда плз, я правильно понимаю пайплайн: 1) создаю схему, просто джейсон строку 2) модулем confluent_kafka.avro регистрирую схему в реджистри, получаю в ответ айдишник схемы, сохраняю 3) далее запрашиваю по этому айдишнику объект схемы из реджистри 4) сериализую сообщение с помощью полученного объекта схемы 5) создаю продюсер с указанием адреса реджистри 6) просто отправляю сообщение т.е. получается продюсер знает адрес реджистри, а сообщение сериализованное с помощью полученного из реджистри объекта в своих первых байтах содержит айдишник схемы. Спасибо)
Обсуждают сегодня