вас насколько верно мое расследование.
Итак. Есть подозрение, что у приложения текут сокеты. Часто в netstat -aon можно увидеть увеличение CLOSE_WAIT записей как:
tcp 1 0 127.0.0.1:8180 127.0.0.1:57160 CLOSE_WAIT off (0.00/0/0)
Stackoverlfow говорит:
Your server is failing to detect client disconnects, or ignoring them, and not closing the socket.
Окей, влючаем tcpdump, смотрим на поведение когда все плохо:
2020-06-08 06:55:30.282015 IP 127.0.0.1.8180 > 127.0.0.1.57160: Flags [.], ack 1380, win 1365, options [nop,nop,TS val 2780208201 ecr 2780208201], length 0
2020-06-08 06:57:10.279006 IP 127.0.0.1.57160 > 127.0.0.1.8180: Flags [F.], seq 1380, ack 1, win 342, options [nop,nop,TS val 2780308198 ecr 2780208201], length 0
2020-06-08 06:57:10.318432 IP 127.0.0.1.8180 > 127.0.0.1.57160: Flags [.], ack 1381, win 1365, options [nop,nop,TS val 2780308238 ecr 2780308198], length 0
И правда, видим в конце клиент отправляет FIN-ACK [F.], но сервер ничего ему не отвечает. Смущает еще факт, что он отчаяно отправляет FIN-ACK почти через 2 минуты после последнего пакета, но это ничего не решает, потому что сервер то ничего не отправляет, поэтому CLOSE_WAIT как висел так и висит.
Теперь смотрим на логи, когда все классно:
2020-06-08 06:58:23.073139 IP 127.0.0.1.8180 > 127.0.0.1.57786: Flags [P.], seq 1:738, ack 1211, win 1365, options [nop,nop,TS val 2780380992 ecr 2780380974], length 737
2020-06-08 06:58:23.073233 IP 127.0.0.1.8180 > 127.0.0.1.57786: Flags [F.], seq 738, ack 1211, win 1365, options [nop,nop,TS val 2780380992 ecr 2780380992], length 0
2020-06-08 06:58:23.073302 IP 127.0.0.1.57786 > 127.0.0.1.8180: Flags [F.], seq 1211, ack 739, win 353, options [nop,nop,TS val 2780380992 ecr 2780380992], length 0
И видим, что сервер отправляет FIN-ACK [F.] первый, сразу же клиент делает тоже самое [F.].
Правильны ли мои догадки? Получается, что наше приложение не закрывает корректно соединение? Какие тут могут быть еще потенциальные проблемы?
Буду рад выслушать любые комменты)
Ответ - cloudflare в 2016? https://blog.cloudflare.com/this-is-strictly-a-violation-of-the-tcp-specification/
Обсуждают сегодня