171 похожих чатов

Добрый день! есть пару сайтов, находящихся где-то на Украине у одного

хостера. Наш робот периодами к ним
ходит и собирают с них какую-то инфу. Периодически робот сталкивается с сетевыми ошибками.
Владельцы этих сайтов заинтересованы, чтобы наш робот к ним ходил и не было таких проблем.
Был некоторый пинг-понг между нами и техподдержкой того хостера о том, на чьей же стороне проблема.
В общем мне передали задачу. Было бы довольно просто, если бы проблема воспроизводилась постоянно, но
она очень плавающая (mtr вроде б могла немного прояснить ситуацию).
Т.к. у нас графитовый стек для приема метрик, я настроил плагин ping у collectd. Получаю метрики по
времени отклика и drop rate пингов.
Робот находится в ДЦ одного хостера N. У данного хостера 2 независимых канала, робот ходит через первый.

Получение метрик настроил по следующему принципу: пару серверов (на одном из них работает робот), выходящих в сеть через 1-ый канал ДЦ
хостера N, один сервер - через 2-ой, еще один сервер - находится в хетцнере.

После некоторого наблюдения видно, что drop rate с наших серверов, находящихся в ДЦ хостера N, периодами достигает 20%.
А у сервера, находящегося в hz, потерь практически нет (ну или иногда бывает в пару %).
Хотя наш хостер N и заявляет, что у него 2 совсем независимых канала, но пока метрикам подтверждается, что
проблема есть.
Но теперь встает вопрос - как более полно понять где именно проблема?
Видится, что надо нечто mtr-а, которая будет запускаться периодами и показывать потери/время отклика по каждому
из хопов ведущему к проблемному сайту. Как вообще такие метрики получить?
Понятно, что mtr не является сильно точной методикой проверки, но есть метод лучше?

1 ответов

23 просмотра

Смысла мерить дропы у хопов мало. Потому что отвечает тебе контрол плейн, а трафик форвардит датаплейн.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта