Но может посоветует кто в какую сторону смотреть. Ситуация такая. Есть серврер физический на Centos, на нем крутится гошный софт и тарантул. Гошный софт создает подключения к сайтам в интернете и запрашивает/отдает данные. Все идет хорошо, но с периодичностью где то раз в 2 дня на серваке перестает работать сеть, ни Гошный софт, ни тарантул ни ssh не могут установить какие либо сетевые соединения (при этом сам сервак, судя по логам работает нормально). После рестарта сервера счетчик идет с нуля и снова где то на 2-й день все по новой. В логах сервера ошибок нет от слова вообще.(ни в dmesg ни в message) Пытаюсь обвесить сервер метриками сейчас, но трудно сразу угадать куда смотреть. Из предположений моих только то, что Гошный софт копит коннекты и при превышении net.netfilter.nf_conntrack_max просто не устанавливаются новые соединения. Пытаюсь получить подтверждение этому. Еще вариант с проблемами сетевой карты или кабелем(но это на мой взгляд менее вероятно)
Есть у кого идеи что можно помониторить, чтоб поймать за руку бандита?
я бы смотрел счётчики можно через тулзы, можно через /proc: /proc/net/dev, /proc/net/netstat, /proc/net/sockstat, /proc/net/nf_conntrack, /proc/net/snmp в состоянии "нормально" и в состоянии "сломалось"
есть подозрение что у гошного хттп клиента заканчиваются подключения
там у всего заканчивается сеть, не только у гошки
Обсуждают сегодня