TSDB, которая определена в promtheus-operator ).
Поставил тест и пошел пить чай. Когда пришел, прометей в циклической перезагрузке, т.к. пытается загрузить все данные из TSDB в RAM, ему не хватает RAM, OOM-killer его грохает и так по кругу.
Нагрузочный тест конечно отключил, но как почистить TSDB от тестовых логов не знаю (контейнер не поднимается, поэтому через REST не могу его почистить).
Может быть можно как-то загрузить прометей, чтобы он не выедал всю память (с каким-то спецефическим флагом)?
Вопросы:
1) Кто-нибудь может подскзать, как почистить TSDB от ненужных метрик, если prometheus не запускается ?
2) С помощью Victoria Metrics( или Thanos например) можно же избежать подобных проблем (переполнение памяти) ? Если есть уже описанные подобные кейсы, просьба кинуть линк.
Про вопрос номер раз - а что мешало просто под удалить?
Отличная статья, которая объясняет многие проблемы, которые я повстречал при первом нагрузчоном тетсировании Prometheus … Рекомендую… https://habr.com/ru/company/funcorp/blog/445370/
Обсуждают сегодня