172 похожих чатов

Господа, вечер добрый хелпаните сложить всё в кучу, пожалуйста в кубере работает

11 сервисов, мониторяться прометеем, темплейт с офф репозитория, по http делает проверку , 1 сервис(для пуш уведомлений на мессенджеры, стороннее API) с регулярной периодичностью шлёт алерты, что не верное тело ответа согласно регулярке, но резолвится само в течении 3-5 минут, и так за день может 1-2 раза, а может и 20+, дергал curl ом постоянно ответ 201 result:true , в логи пишет, я понять не могу , ошибка со стороны API стороннего, приложения, или девопсов косяк? разрабы меня убеждают что мониторинг не верен, хотя по логике другие сервисы норм работают
куда копать? посоветуйте

13 ответов

26 просмотров

Не верить никому, достать и вдумчиво прочитать логи.

Pasha-Shredder Автор вопроса
Dmitry D
Не верить никому, достать и вдумчиво прочитать лог...

меня уже укачало от них, там кроме запросов и ответов ничего, и по ошибке которую я ищу тоже голяк, всё что было уже перелопатил

Залезь в пром да посмотри

Pasha-Shredder Автор вопроса
Dmitry D
Не верить никому, достать и вдумчиво прочитать лог...

я бы ещё понял если бы курл через раз работал, а так 10+ закинул, всё в логи лягло, неделю назад ещё 1 сервис мозги делал, но как выяснилось косяк разрабов был, запрос кривой , а тут я прям завис

Мониторинг врать не будет - он тупой. Значит раз в сколько-то запросов отдаётся неверный ответ. Если есть доступ к логам сервиса - грепай их по хелсчеку и ищи ошибку. Если нет доступа к логам - включай на проме полный дамп запросов и ответов для этого сервиса (гугли как это делать). С дампом и таймстемпами иди к хозяину сервиса.

Pasha-Shredder Автор вопроса

Ну в целом я так и сделал, вытянул всё из логов и мониторинга в отдельные файлы, и отдал клиенту, меня поражает что в это происходит в 90% случаях предсказуемо, раз в пол часа, час, и резрлвится с таким же процентом через 3-5 минут, хоть часы сверяй

Pasha Shredder
Ну в целом я так и сделал, вытянул всё из логов и ...

Это как раз нормально. Большинство процессов внутри компьютера происходят регулярно. Потомушто у ней внутре часики.

Nick Kritsky 🇺🇦
Мониторинг врать не будет - он тупой. Значит раз в...

пром разве такое умеет? слать http запросы произвольные и проверять тело ответа регекспом? Зачем на проме дам смотреть

Pasha-Shredder Автор вопроса
Andrey Kartashov
пром разве такое умеет? слать http запросы произво...

Он проверяет на result:true/false, то есть если тело ответа пустое или ещё что-то , кидает алерт, я так себе думаю

Pasha Shredder
Он проверяет на result:true/false, то есть если те...

не надо "себе думать", надо взять и сделать, и посмотреть. Если действительно сервис сбоит, ты увидишь разницу в теле ответа. А так твои думы разрабу не аргумент, он по прежнему будет говорить что твой мониторинг говно, а с сервисом всё в порядке, и будет прав

Pasha-Shredder Автор вопроса

Да

Pasha Shredder
Да

https://t.me/devops_ru/1064277

Pasha-Shredder Автор вопроса
Andrey Kartashov
https://t.me/devops_ru/1064277

Но при этом ошибки в мониторинг прилетали, хоть мне показалось что реже

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта