эффективно это работает в связке?
да, отлично работает
Я не работал с кафкой, есть ли возможность настраивать источники, мне например нужно забирать данные из разных источников, например: google sheets mysql postgresql s3 И т.д... всего порядка 50 - 60 источников
Вы же хотите из kafka забирать данные в clickhouse. А уже как вы из этих источников будете лить в кафку - это другой отдельный вопрос.
Понял, просто думал, мало ли там есть подобный функционал, но видимо это другое)
источник настроить не проблема - insert into table select * from url/mysql/pg/s3 другое дело, что 50 таблиц - уже кучка и вам скорее всего нужно реализовывать полноценный ETL процесс (или ELT) Кафка не совсем подходящий инструмент для этой цели (она может быть только частью). Можете посмотреть в сторону airflow или DBT
На данный момент использую airbyte, но он ещё сильно молодой, много нужного нет, приходится дописывать. Просто стало интересно насчет кафки узнать, также читал про её интеграцию с camel
если он вас устраивает по входам и трансформациям, то направляйте его выход в кафку, а из нее вычитывайте прямо в КХ - https://clickhouse.com/docs/en/engines/table-engines/integrations/kafka/
А в кафке есть система веб-хуков? Например я лью туда данные, и по завершению джоба, мне нужен ответ, что и куда перешло
тут группа не про кафку. в интернете есть миллион статей про нее. самое время найти что-то на каком-нибудь медиуме и прочитать.
Хорошо, спасибо за ответы!
https://t.me/proKafka
Обсуждают сегодня