пропала связь, они находились на одной ноде, в логе cert-manager такие сообщения:
"msg"="re-queuing item due to error processing" "error"="Internal error occurred: failed calling webhook \"webhook.cert-manager.io\": Post https://cert-manager-webhook.cert-manager.svc:443/mutate?timeout=30s: context deadline exceeded"
По cervice-у и endpoint-ам всё было правильно
передеплоил cert-manager с affinity для webhook-пода, чтобы ушёл на другую ноду - проблема ушла.
cni - calico
Как дебажить такие ошибки?
curl + tcpdump 🤷♂
особенно при tls поможет tcpdump, да
Что мешаешь расшифровать трафик в каком-то wireshark?)
А что вы там видеть собираетесь?)
зайди шеллом в под и попробуй курлом ткнуть нужный сервис
в контейнерах cert-manager-а нет шела, там bazel-ем собрано, ничего лишнего нет.
ну тоже не проблема, запусти аналогичный под в том же неймспейсе с нодселектором и ставь опыты
Обсуждают сегодня