скейлиться пул нод при нехватке CPU или оперативки. На каждый под установлены requests ресурсы.
Судя по этой фразе из документашки "If your Pods have requested too few resources (or haven't changed the defaults, which might be insufficient) and your nodes are experiencing shortages, cluster autoscaler does not correct the situation. You can help ensure cluster autoscaler works as accurately as possible by making explicit resource requests for all of your workloads.", пул нод масштабируется именно в зависимости от requests ресурсов.
Request ресурсы выставил практически впритык работы каждого пода. Но когда HPA масштабирует поды при нагрузке, то некоторые поды просто пишет о недостаточном количестве CPU, но пул нод остаётся прежним.
Для примера, запрашиваю 25m из одного ядра (у которого лимит 940m и у которого занято уже 925m) и поды просто остаются в pending. Разве scheduler не должен скейлить пул нод кластера?
А вы создавали кластер с автоскейлингом? Не уперлись в max?
а че пишет в евентах этих подов (которые в Pending). Обычно autoscaler туда сообщения пишет. Напирмер он может решить, что после скейла вверх, на эту ноду под не сможет заехать из-за афинити или selector. Если логи автоскейлера есть, то их тоже можно глянуть
Обсуждают сегодня