мониторите, чтобы понимать что каждый компонент работает корректно?
Иногда бывают проблемы, что логи не пишутся например и хотелось бы в них быстрее разбираться.
Мониторите ли вы только место и ридонли индексы или что-то еще есть интересное?
это батч процессинг система. монитонить надо e2e processing time(как долго летит от вылета до индекса), throughput(сколько летит), freshness (есть ли свежие данные), correctness(все данные вылетевшие прилетели)
Обсуждают сегодня