Логи целиковымии файлами попадают на него с разных сервисов. Их нужно чем то парсить, чем посоветуете? Например nginx, у нас его лог расширенный с доп параметрами (access.log)
Если объемы огромные на nginx'е, пишите свои предагрегаторы/парсеры. У нас на nginx-серверах утилита на ноде приводит их в нормальный вид и отправляет в КХ. Все другие варианты просто не вывозили. Где именно находится парсер и на чем написан — не особо важно, понятно. Мы на серверы nginx-а положили, чтобы сеть насиловать поменьше.
нормальный вид? json ?или один из поддерживаемых форматов
Ну мы парсим access-log, всякие там upstream_rt и кучу всего еще и засылаем просто VALUES. Между кх и парсером стоит еще киттенхаус, но тут каждый делает, как хочет.
примерно тоже самое. рассматриваем вариант альтернативу elk
Вот когда у нас был ELK, L вообще выкинули, парсер писал напрямую в E. И приходилось аггрегировать по секунде, иначе не вывозило. С кх попроще вышло, можно каждое событие писать отдельно и появились возможности. Но логика с парсингом не поменялась.
Обсуждают сегодня