на большом количестве метрик обожралась памяти(35 ГБ ОЗУ) и oom киллер приходил и убивал её. Графана завалила всех алертами. Таргетов там было хоть и много(~2000), но общий объём данных за 30 дней - 260ГБ, что в целом не так уж и много. Но судя по всему Victoria Metrics решила зачитать всё что есть на диске.
На дефолтах запускали?
тюнингом не занимался, это да
а что справилось с нагрузкой?
Ну так а чего вы ожидаете от дефолтов? Там вроде для калькуляторов они оптимизированы
когда-то давно influx первой версии 2ТБ тянул, с глубиной хранения 1 год на дефалтовых настройках, мониторил vSphere со всеми метриками на 2к виртуалок.
ничего не ожидаю и не не говорю, что VictoriaMetrics какой-то плохой софт
Дело не в том плохой или нет. Дело в том, что без тюнинга ни один софт нагрузку не держит
ну не любой, тот же кликхаус бы не расстроился и oom киллер его не пристреливал и на куда больших запросах. При этом он продолжал писать метрики, ответа, конечно ждать приходилось по несколько минут, но он и вычитывал по паре сотен ГБ.
виктория позицианирует ся что ее не надо тюнить.
Я бы не был так уверен - Кликхаус отлично умеет умирать от ООМа. Разве что вы записываете каждой точкой новую тайм серию - тут VM может действительно расстроится. Но это уже будут не временные ряды и не профильная нагрузка.
возможно, однако я не видел чтобы он это делал просто пытаясь запустится и перечитывая доступные данные.
Обсуждают сегодня