Память выедается всё, но не резко и сильно, поэтому OOM killer не триггерится. Из-за этого ядро начинает тупить, пытаясь высвободить как можно больше страниц памяти освободить, writeback становится синхронным, кэши сокращаются все и вот это всё.
Что делать? Правильно настраивать requests/limits.
а куда здесь копать, когда поды одновременно выкатываются?
Погоди - с чего это ядро должно выискивать - это управление идет в рамках контейнера а не узла - с 11 версии там все правильно пофиксено - то есть убивается процесс в контейнере но не системные процессы. OOM нацелен на процесс а не на всю память. У тебя хоть какая версия кубера стоит ?
Обсуждают сегодня