кастомный autoscaler, который зависит скажем не от метрик CPU или memory utilization а от скорости ответа на запрос?
Допустим, в сервисе есть X реплик HTTP сервера, и мы хотим чтобы ответ всегда приходил не менее, чем за 2 секунды, если больше - поднять ещё одну реплику.
Есть
можно вообще кастомный метрикс-сервер сделать, если очень хочется
Это все на бумаге работает гладко, в жизни запросы будут долгими, потому что ДНС затупил, а в это время автоскейлер вам подов расплодит, за ним кластер автоскейлер ещё и нод подгонит :)
Обсуждают сегодня