реббита, и батчами отправляет в кликхаус, у него есть метрики которые собираются в горутине и по хендлеру периодически забираются прометеусом, раз в неделю иногда чаще сервис залипает, в логах никаких ошибок не обычных не выдает, никакой паники, просто сервис висит, метрики прометеус не отдает, как вобще можно отследить из-за чего происходит зависание? помогает только перезапуск контейнера
pprof хэндлеры добавь в сервис, попробуй подключиться потом, когда зависнет, посмотреть по чё там вообще происходит.
можно ещё снять дамп приложения, и его уже анализировать
Обсуждают сегодня