состояние арены в человекопонятном виде: квота X Gb, использовано Y%, из них арена Z Gb, использовано K%, количество спейсов по типам (мемтикс/винил)
3. состояние репликации: lag, работает, частично развалилась, не работает
4. стату по запросам и сети в виде rps, но не за последнюю секунду, а растянутое хотя-бы секунд на 10.
5. "Рантайм" инфа: память луа, кол-во файберов, rps по cws, потребление cpu различными тредами/файберами, среднее время cpu на файбер. возможно пиковый usage в % readahead буферов.
6. Стата по винилу, но тут я пока пас выписать хоть пару опций.
В виде метрик хочется почти то-же самое, но немного в другом виде:
1. server: lsn, uptime
2. arena (всё в байтах): quota(total/used), arena(total/used), если возможна детализация на спейсы, индексы, винил и прочее, то тоже.
3. replication: id+lsn+lag
4. stats: сырые счётчики (op/net), без rps. любая система сбора метрик сделает из них графики
5. runtime: fibers count + (csw/cpu/memory) per fiber, memory(lua/fibers/buffers?)
6. винил. опять-же там много всего, TODO.
как то напонимает забикс
Спасибо, Монс! Мы планомерно разбираемся с каждым вопросом. Пока из готового стоит посмотреть на box.info.replication в 1.7.5 - там уже есть всё, что ты хочешь. Мониторинг памяти - следующий в очереди.
Обсуждают сегодня