172 похожих чатов

Господа, вечер добрый хелпаните сложить всё в кучу, пожалуйста в кубере работает

11 сервисов, мониторяться прометеем, темплейт с офф репозитория, по http делает проверку , 1 сервис(для пуш уведомлений на мессенджеры, стороннее API) с регулярной периодичностью шлёт алерты, что не верное тело ответа согласно регулярке, но резолвится само в течении 3-5 минут, и так за день может 1-2 раза, а может и 20+, дергал curl ом постоянно ответ 201 result:true , в логи пишет, я понять не могу , ошибка со стороны API стороннего, приложения, или девопсов косяк? разрабы меня убеждают что мониторинг не верен, хотя по логике другие сервисы норм работают
куда копать? посоветуйте

13 ответов

7 просмотров

Не верить никому, достать и вдумчиво прочитать логи.

Pasha-Shredder Автор вопроса
Dmitry D
Не верить никому, достать и вдумчиво прочитать лог...

меня уже укачало от них, там кроме запросов и ответов ничего, и по ошибке которую я ищу тоже голяк, всё что было уже перелопатил

Залезь в пром да посмотри

Pasha-Shredder Автор вопроса
Dmitry D
Не верить никому, достать и вдумчиво прочитать лог...

я бы ещё понял если бы курл через раз работал, а так 10+ закинул, всё в логи лягло, неделю назад ещё 1 сервис мозги делал, но как выяснилось косяк разрабов был, запрос кривой , а тут я прям завис

Мониторинг врать не будет - он тупой. Значит раз в сколько-то запросов отдаётся неверный ответ. Если есть доступ к логам сервиса - грепай их по хелсчеку и ищи ошибку. Если нет доступа к логам - включай на проме полный дамп запросов и ответов для этого сервиса (гугли как это делать). С дампом и таймстемпами иди к хозяину сервиса.

Pasha-Shredder Автор вопроса

Ну в целом я так и сделал, вытянул всё из логов и мониторинга в отдельные файлы, и отдал клиенту, меня поражает что в это происходит в 90% случаях предсказуемо, раз в пол часа, час, и резрлвится с таким же процентом через 3-5 минут, хоть часы сверяй

Pasha Shredder
Ну в целом я так и сделал, вытянул всё из логов и ...

Это как раз нормально. Большинство процессов внутри компьютера происходят регулярно. Потомушто у ней внутре часики.

Nick Kritsky 🇺🇦
Мониторинг врать не будет - он тупой. Значит раз в...

пром разве такое умеет? слать http запросы произвольные и проверять тело ответа регекспом? Зачем на проме дам смотреть

Pasha-Shredder Автор вопроса
Andrey Kartashov
пром разве такое умеет? слать http запросы произво...

Он проверяет на result:true/false, то есть если тело ответа пустое или ещё что-то , кидает алерт, я так себе думаю

Pasha Shredder
Он проверяет на result:true/false, то есть если те...

не надо "себе думать", надо взять и сделать, и посмотреть. Если действительно сервис сбоит, ты увидишь разницу в теле ответа. А так твои думы разрабу не аргумент, он по прежнему будет говорить что твой мониторинг говно, а с сервисом всё в порядке, и будет прав

Pasha-Shredder Автор вопроса

Да

Pasha Shredder
Да

https://t.me/devops_ru/1064277

Pasha-Shredder Автор вопроса
Andrey Kartashov
https://t.me/devops_ru/1064277

Но при этом ошибки в мониторинг прилетали, хоть мне показалось что реже

Похожие вопросы

Обсуждают сегодня

Комрады, посоветуйте, куда копать? Стал прикручивать кастомизацию тем. В OnShow главной главной формы пытаюсь загрузить из файла настроек и применить тему (на скрине, как долж...
Ed Doc
13
OnShow один раз вызывается? или возможен Hide?
Iluha Companets
14
Такс, блин, таки кто-то знает, каким образом работают макросы stdin/stdout/stderr? Я влез в stdio.h, там определения нет, отладил через асмокод - вызывается функция со странны...
The Bird of Hermes
18
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Всем привет, на линуксе лучше на fasm или nasm учиться писать для начала ?
meszjol
14
Если у меня есть такой класс: Object = {} function Object:new(a_name, a_transform, a_color, a_mesh, a_material, a_shader, a_textures) local private = {} private.n...
Cuarno Vile
4
@sand_witch скорее к тебе вопрос, добавил в .cabal webdriver-w3c и вот такая ошибка от nix develop error: Package ‘script-monad-0.0.4’ in /nix/store/7vdxbra0kwbr0ys0kc5...
Fedor
5
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
I have a type conversion problem, I have a optional field, it contains a list of integers or null, when I try to convert it from sqflite I use above method, but when it is nul...
Alper
2
Карта сайта