же, насколько надежно использовать kafka как source of truth для других хранилищ? Сейчас из кафки запись идет в кассандру и эластик, есть варик отказаться от кассандры, навечно писать данные в кафку чтобы в случае чего делать наполнение эластика. Какова вероятность потери данных в кафке, нужно ли ее дополнительно бэкапить?
Это философский вопрос :) Мы написали свой бэкап, потому что трудно было убедить заказчика, что он не нужен по сути. Если вы можете настроить кафку на durability, а не на throughput, то я бы сказал, что бэкап не нужен, так как по сути built-in replication механизм сделает это за вас. Если нет, то синхронно бэкапить кафку, где несколько топиков семантически связаны, сложно, также как и синхронно бэкапить несколько хранилищ, которые с этих топиков заполняются. Вообщем проблему консистентности придётся решать.
это называется kappa архитектура
Обсуждают сегодня