AWS ELB который смотрит на istio-ingressgateway (LB сервис для истио работает в режиме externalTrafficPolicy: Local). за истио стоит аппка которая собственно и обрабатывает все запросы. в определенных случаях эта аппка выполняет запросы "к самой себе" через публичный DNS который направлен на тот же AWS ELB
в целом, сетап работает, 1.5К rps держит без проблем вот только запросы от внутреннего сервиса "к самому себе" иногда выпадают в жуткий таймаут (10-30 сек) на этапе tcp handshake что приводит к ХТТП ошибкам. судя по всему такое происходит только с запросами которые идут из внутренней сети кластера (тестировал из пода той же аппки) и проблема начинает воспроизводиться после некоторых значений rps (>10). что это может быть?
Точно TCP handshake , а не какой-нибудь ДНС?
Обсуждают сегодня