170 похожих чатов

@Svetsmirnova есть вопрос по pmm. Он у нас запущен в

кубере и пода стала утилизировать всю цпу подкинули уже ей 14 ядер, мониторит 250+ инстансов
утилизирует все grafana сервис
не планируется ли у сделать pmm на несколько под разибвать по сервисам чтоб можно было было их по отдельности скейлить ?

8 ответов

16 просмотров

Я спрошу. Мы что-то делаем для scale и кубера, но сомневаюсь, что для PMM сервера сейчас планируется такое на ближайшее время

Вполне нормально завести один pmm per dc/region. Можно ещё вместо стандартного сервиса использовать свой, буферизировать данные и слать большой пачкой. У нас много pmm, плюс простой веб сервер и cli к нему, которые умеют перекидывать на нужный pmm по хостнейму бд.

Viktor-🇨🇾 Автор вопроса
svart
Вполне нормально завести один pmm per dc/region. М...

Но у нас именно графана начала исполнять (

Viktor 🇨🇾
Но у нас именно графана начала исполнять (

извините, но я не понял. да и неважно, наверное

Viktor-🇨🇾 Автор вопроса
svart
извините, но я не понял. да и неважно, наверное

У нас внутри поды pmm-server , графана все цпу съедает, вот ищем решения с минимальными кастылями

Viktor 🇨🇾
У нас внутри поды pmm-server , графана все цпу съе...

это я как раз таки понял. я не понял предыдущий ответ: все слова по отдельности понятны, а складываются во что-то непонятное. мне в свое время не удалось решить аналогичную проблему и пришлось поднимать новые инстансы. светлана лукавит, когда говорит, что у вас уникальная проблема. вы, скорее всего, гуглили и видели что у многих есть подобная проблема. в одном месте фиксят - в другом отваливается. ну, в целом, это мое личное мнение. вариантов три: 1) репортить баг и ждать, что пофиксят; 2) заводить разные инстансы; 3) слезть с иглы. я кроме проблемы с cpu решал еще проблемы с сетью и для меня приемлимым решением было pmm-per-dc. было бы больше времени, то я бы выбрал третий вариант. ах, да, и у меня не кубик, но я не думаю, что это уж какая-то критическая разница

Viktor-🇨🇾 Автор вопроса
svart
это я как раз таки понял. я не понял предыдущий от...

Но там да странная технология через супервизор все работает. Почему не пойти в сторону микросервисов. А какие проблемы с сетью? Чтоб понимать что можно ожидать

Viktor 🇨🇾
Но там да странная технология через супервизор все...

имхо, потому что так шипить проще юзерам. этой штукой пользуются многие и простота подкупает. ну и, разумеется, это прекрасный selling point. касательно сети - там ничего интересного. проблема, скорее на стороне провайдеров, просто pmm-agent реагировал на latency иногда отваливаясь, тогда как остальной софт работал нормально. раздражали false positive алерты.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта