172 похожих чатов

После ротации сертификатов, на одном из мастеров, командой /usr/local/bin/kubeadm certs

renew all перестал запускаться kubelet.service.
В логе ошибки:
kubelet[13777]: E1018 10:32:34.626528 13777 node_container_manager_linux.go:57] "Failed to create cgroup" err="Unit kubepods.slice already exists." cgroupName=[kubepods]

kubelet[13777]: E1018 10:32:34.626549 13777 kubelet.go:1384] "Failed to start ContainerManager" err="Unit kubepods.slice already exists."

systemd[1]: kubelet.service: Main process exited, code=exited, status=1/FAILURE

systemd[1]: kubelet.service: Failed with result 'exit-code'.

Никто с таким поведением не сталкивался?

На остальных двух мастерах сертификаты обновились без проблем и всё работает.

Kubernetes v1.21.4

14 ответов

28 просмотров

Текст ошибки ни на что не намекает?

Посмотри ещё в journalctl -xeu kubelet.service есть ещё какая информация?

Vadim Viktorovich- Автор вопроса
Фредди
Посмотри ещё в journalctl -xeu kubelet.service е...

Это ошибки которые есть при загрузке.

Апи сервер не подымается похоже

George Gaál
Апи сервер не подымается похоже

Но это скорее следствие, а не причина проблем

Vadim Viktorovich- Автор вопроса
George Gaál
Апи сервер не подымается похоже

RHEL 8.4, кубспрей, контейнерди не обновляли. Только ротация сертификатов.

Vadim Viktorovich
RHEL 8.4, кубспрей, контейнерди не обновляли. То...

Кубеспрей выкинь. Версии пакетов на узлах проверь все равно

Fastumkruk
Что если не куб спрей?

kubeadm или самому напиши свой ansible

Vadim Viktorovich- Автор вопроса

Если кому интересно. После сравнения содержимого /etc/systemd/system/ на рабочих нодах оказалось, что на проблемной ноде, по этому пути, есть юнит kubepods.slice, после удаления которого кублет запустился и нода заработала. Я так понимаю, его там быть не должно. Откуда он там взялся вообще не понятно. Лежит он там с 4 августа. Судя по логам 4 августа виртуалка падала, и видать, из-за некорректного завершения работы, этот файл там образовался. Другого у меня предположения нет. Короче, хрень какая-то произошла. Команда /usr/local/bin/kubeadm certs check-expiration показывает теперь нормальную картину.

Vadim Viktorovich- Автор вопроса
Sn♾p
а флаги используете —*reserved?

Не знаю, где посмотреть?

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Карта сайта