172 похожих чатов

Господа, вечер добрый хелпаните сложить всё в кучу, пожалуйста в кубере работает

11 сервисов, мониторяться прометеем, темплейт с офф репозитория, по http делает проверку , 1 сервис(для пуш уведомлений на мессенджеры, стороннее API) с регулярной периодичностью шлёт алерты, что не верное тело ответа согласно регулярке, но резолвится само в течении 3-5 минут, и так за день может 1-2 раза, а может и 20+, дергал curl ом постоянно ответ 201 result:true , в логи пишет, я понять не могу , ошибка со стороны API стороннего, приложения, или девопсов косяк? разрабы меня убеждают что мониторинг не верен, хотя по логике другие сервисы норм работают
куда копать? посоветуйте

13 ответов

23 просмотра

Не верить никому, достать и вдумчиво прочитать логи.

Pasha-Shredder Автор вопроса
Dmitry D
Не верить никому, достать и вдумчиво прочитать лог...

меня уже укачало от них, там кроме запросов и ответов ничего, и по ошибке которую я ищу тоже голяк, всё что было уже перелопатил

Залезь в пром да посмотри

Pasha-Shredder Автор вопроса
Dmitry D
Не верить никому, достать и вдумчиво прочитать лог...

я бы ещё понял если бы курл через раз работал, а так 10+ закинул, всё в логи лягло, неделю назад ещё 1 сервис мозги делал, но как выяснилось косяк разрабов был, запрос кривой , а тут я прям завис

Мониторинг врать не будет - он тупой. Значит раз в сколько-то запросов отдаётся неверный ответ. Если есть доступ к логам сервиса - грепай их по хелсчеку и ищи ошибку. Если нет доступа к логам - включай на проме полный дамп запросов и ответов для этого сервиса (гугли как это делать). С дампом и таймстемпами иди к хозяину сервиса.

Pasha-Shredder Автор вопроса

Ну в целом я так и сделал, вытянул всё из логов и мониторинга в отдельные файлы, и отдал клиенту, меня поражает что в это происходит в 90% случаях предсказуемо, раз в пол часа, час, и резрлвится с таким же процентом через 3-5 минут, хоть часы сверяй

Pasha Shredder
Ну в целом я так и сделал, вытянул всё из логов и ...

Это как раз нормально. Большинство процессов внутри компьютера происходят регулярно. Потомушто у ней внутре часики.

Nick Kritsky 🇺🇦
Мониторинг врать не будет - он тупой. Значит раз в...

пром разве такое умеет? слать http запросы произвольные и проверять тело ответа регекспом? Зачем на проме дам смотреть

Pasha-Shredder Автор вопроса
Andrey Kartashov
пром разве такое умеет? слать http запросы произво...

Он проверяет на result:true/false, то есть если тело ответа пустое или ещё что-то , кидает алерт, я так себе думаю

Pasha Shredder
Он проверяет на result:true/false, то есть если те...

не надо "себе думать", надо взять и сделать, и посмотреть. Если действительно сервис сбоит, ты увидишь разницу в теле ответа. А так твои думы разрабу не аргумент, он по прежнему будет говорить что твой мониторинг говно, а с сервисом всё в порядке, и будет прав

Pasha-Shredder Автор вопроса

Да

Pasha Shredder
Да

https://t.me/devops_ru/1064277

Pasha-Shredder Автор вопроса
Andrey Kartashov
https://t.me/devops_ru/1064277

Но при этом ошибки в мониторинг прилетали, хоть мне показалось что реже

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
1
Он в одиночку это дело запилил или была какая-то команда?
Aquinary
12
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Карта сайта