172 похожих чатов

Всем привет, кто-то сталкивался с такой проблемой? level=error msg="Handler for

GET /system/df returned error: context canceled"
level=error msg="Handler for GET /images/json returned error: write unix /run/docker.sock->@: write: broken pipe"
http: superfluous response.WriteHeader call from github.com/docker/docker/api/server/httputils.WriteJSON (httputils_write_json.go:11)
level=error msg="Handler for GET /system/df returned error: context canceled"
На сервере 8 контейнеров, мониторится заббикс агентом 2, в 1:20 было оповещение что сервис докера упал, что по факту не так, перезапусков не было, насколько я понял проблема в таймаутах, дал запрос ждёт 60 сек, если ответа нет, то далее ошибка, в ручном режиме через заббикс все метрики и данные получаю(вычитал рекомендации об отключении итемов в забексе шаблоне докера что мне кажется такая себе затея), ошибка бывает периодически, не могу понять в чём именно проблема, дайте совет пожалуйста

29 ответов

195 просмотров

Они наверное предлагали отключить все связанное с images,но не с контейнерами. Почему бы нет, ради эксперимента?

И почему явная проблема с производительностью обсуждается без упоминания и описания метрик нагрузки?

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
И почему явная проблема с производительностью обсу...

просто для меня это не явный аспект) по этому и пришёл за советом)

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
И почему явная проблема с производительностью обсу...

другими словами увеличение ресурсов сервера может решить проблему?

Pasha Shredder
просто для меня это не явный аспект) по этому и пр...

Ну как не явный? Что более вероятно, что в docker сохраняется незамеченная проблема с сокетами или что ваша конкретная машина нагружена?

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
Ну как не явный? Что более вероятно, что в docker ...

звучит логично , но то что это произошло ночью, когда нагрузки обычно нет, а днём такого не наблюдается, в течении месяца это второй раз подобного рода ошибка, просто из того что пишут на форумах, я для себя так и не смог понять, проблема это докера, возможно нужно обновиться, или ресурсов

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
Ну как не явный? Что более вероятно, что в docker ...

если не затруднит, можно парой слов описать что именно значат эти ошибки?

Pasha Shredder
если не затруднит, можно парой слов описать что им...

Я предполагаю, что опрос метрик просто не успел. И так несколько раз. Раз есть zabbix, данных чтобы проверить это, должно быть достаточно

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
Хотя, другие триггеры в zabbix не сработали?

только 1 что сервис упал, что по факту не так, я думал мб сетевые проблемы просто в работоспособности приложения , контейнеров и самого сервера не были замечены, ну то есть их не было в принципе

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
Хотя, другие триггеры в zabbix не сработали?

не уверен, но был скачок по дашбордам в заббиксе docker goroutines , насколько я понимаю он отвечает и за запросы и сеть ? и по времени ошибки совпадает

Pasha Shredder
не уверен, но был скачок по дашбордам в заббиксе d...

это рассуждения о триггерах. Но ведь есть просто метрики не превысившие пороги. Они тоже информативны.

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
это рассуждения о триггерах. Но ведь есть просто м...

остальные метрики в норме, а горутина свыше нормы был скачок

Pasha Shredder
не уверен, но был скачок по дашбордам в заббиксе d...

вот это - хз. факт в том, что мониторщики почему-то считают этот показатель важным.

Pasha-Shredder Автор вопроса

вот и я об этом же, если на сервере нет явных ошибок, но триггер сработал, и по дашбордам видно прыжок , то вероятно она важна, и нужно разобраться

Имхо, горутины - бесконечные. Непонятно зачем их заббикс собирает и даже на дашборд выводит.

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
Имхо, горутины - бесконечные. Непонятно зачем их з...

просто другого логического объяснения этому я не вижу, пока что, и пока это выглядит основным источником проблемы, мб действительно нужно обновить докер, он до меня на проекте ставился, мб 1.5-2 года назад

Pasha Shredder
вот и я об этом же, если на сервере нет явных ошиб...

Я думаю пора забить на это. Может хранилка смигрировала, может еще что. Вас объяснительную на каждую ошибку продолжительностью минуту заставляют писать?

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
Я думаю пора забить на это. Может хранилка смигри...

эмм) есть такое, "почему ошибка"? "как будешь устранять что бы не появлялась вновь"? и тд)

Pasha Shredder
эмм) есть такое, "почему ошибка"? "как будешь устр...

ну выгрузите все-все метрики и эксельку отошлите. и прикрепите методичку по факторному анализу.

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
ну выгрузите все-все метрики и эксельку отошлите. ...

клиент непростой просто) в любом случае благодарю за коммуникацию и советы)

Pasha Shredder
остальные метрики в норме, а горутина свыше нормы ...

возможно, следы какого-то процесса остались в логах самого докера

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
возможно, следы какого-то процесса остались в лога...

всё штатно работает, вот сейчас опять так же ошибка но без алерта...по журналу что вижу, и в дашборе тоже скачок на горутине

Pasha Shredder
всё штатно работает, вот сейчас опять так же ошибк...

так понятно что штатно, но есть ли сообщения регулярно близкие по времени с этими проблемами?

Pasha-Shredder Автор вопроса

во время деплоя был скачок, в дженкинсе запустили пайплайн, 40 минут назад, и во время был скачок

Pasha Shredder
во время деплоя был скачок, в дженкинсе запустили ...

да нет там прямого лимита на горутины. это просто было бы глупо. они "бесплатные". есть еще какой-то лимит или ресурс. А число горутин собирается просто потому что это легко собрать и они могут свидетельствовать о числе каких-то изменений в docker.

Pasha-Shredder Автор вопроса
Pavel Zheltouhov
да нет там прямого лимита на горутины. это просто ...

может вы и правы за ресурсы, странно что ночью был скачок по загрузке системы и СПУ и большой скачок по сетевому трафику

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Он в одиночку это дело запилил или была какая-то команда?
Aquinary
12
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Oh sorry did you want it in Gunter's chains?
Martin Rys
15
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Карта сайта