нексус производится атака или он перегружен?
исходные данные:
- Nexus OSS 3.67.1-01 на OrientDB
- Total components: ~490 000
- Requests Per Day: ~230 000 / last 24h
- параметры запуска: -Xms8G -Xmx8G -XX:MaxDirectMemorySize=12288m -Dnexus.loadAsOSS=true -XX:+UseTransparentHugePages -XX:+PrintFlagsFinal -XX:+UseG1GC; просадки по ресурсам как-будто бы нет;
- RAMа ему выделено 32 гига, кушает до 25G, больше не наблюдалось;
симптомы: в какой-то момент nexus перестает отвечать на http запросы совсем. Сначала пользователям, а потом и по пробам (разверут в k8s). Очень долго все загружает. Сам nexus стоит за nginx. На нём так и не скажешь, что происходит какого-то рода атака или спамминг. "Взлетов" или превышений по ресурсам - тоже нет.
из интересного: когда начинаются зависоны - джавовый график wait-потоков начинает расти, при том, что он в норме обычно идет по "прямой линии".
куда копнуть и что можно посмотреть?
А что у вас в качестве хранилища?
У nginx коннекты увеличиваются? Есть ли график?
Не гцшит ли, не упирается ли в jetty threads, может в сетку упирается(хотя вряд ли). Могут коннекты на нгинкс выжраться.
файловая система
что-то похожее. Коннектов около 1к, но это не на конкретный ингресс, а на весь пул. Отдельно получить вряд ли сейчас быстро получится =)
блобсы хранятся на NFS на ext4, в той же подсети без фаерволллов
А БД и всякая внутреняя штука где?
Обсуждают сегодня