Size: a a a

Церковь метрик

2021 March 31

IK

Ilya Kaznacheev🥤 in Церковь метрик
Всем привет
Подскажите, а как вы мониторите доступность сервисов в целом? Есть какой-то общий подход, чтобы считать доступность в разрезе времени?
источник

EB

Eugene Bosiakov in Церковь метрик
Ilya Kaznacheev🥤
Всем привет
Подскажите, а как вы мониторите доступность сервисов в целом? Есть какой-то общий подход, чтобы считать доступность в разрезе времени?
Лейбл uptime (при условии что метрика с таким лейблом всегда должна быть больше 0). Соответственно один из нулей в аптайм-векторе считается за даунтайм сервиса
источник

G

GithubReleases in Церковь метрик
prometheus/prometheus tagged: 2.26.0 / 2021-03-31
Link: https://github.com/prometheus/prometheus/releases/tag/v2.26.0
Release notes:
Prometheus is now built and supporting Go 1.16 ([#8544](https://github.com/prometheus/prometheus/pull/8544)). This reverts the memory release pattern added in Go 1.12. This makes common RSS usage metrics showing more accurate number for actual memory...
More
источник

IK

Ilya Kaznacheev🥤 in Церковь метрик
Eugene Bosiakov
Лейбл uptime (при условии что метрика с таким лейблом всегда должна быть больше 0). Соответственно один из нулей в аптайм-векторе считается за даунтайм сервиса
Ого, спасибо
источник

IK

Ilya Kaznacheev🥤 in Церковь метрик
Eugene Bosiakov
Лейбл uptime (при условии что метрика с таким лейблом всегда должна быть больше 0). Соответственно один из нулей в аптайм-векторе считается за даунтайм сервиса
Это же любой лейбл может быть, или есть особый смысл именно в uptime?
источник

EB

Eugene Bosiakov in Церковь метрик
Ilya Kaznacheev🥤
Это же любой лейбл может быть, или есть особый смысл именно в uptime?
любой )
источник

EB

Eugene Bosiakov in Церковь метрик
и еще обычно вводят метрику up
источник

EB

Eugene Bosiakov in Церковь метрик
которая всегда в единице
источник

EB

Eugene Bosiakov in Церковь метрик
а если она absent, значит что-то лежит
источник

IK

Ilya Kaznacheev🥤 in Церковь метрик
У меня есть метрика, которая время со старта отдает. Ее нужно к единице привести, или и так сойдёт?
источник

EB

Eugene Bosiakov in Церковь метрик
Ilya Kaznacheev🥤
У меня есть метрика, которая время со старта отдает. Ее нужно к единице привести, или и так сойдёт?
норм, стандартная практика
источник

IK

Ilya Kaznacheev🥤 in Церковь метрик
Кайф
источник

АП

Андрей Петров... in Церковь метрик
Eugene Bosiakov
а если она absent, значит что-то лежит
А когда у тебя виктория и там несколько кластеров льёт метрики
источник

АП

Андрей Петров... in Церковь метрик
Я вот так и не догнал как красиво реализовать абсент
источник

EB

Eugene Bosiakov in Церковь метрик
Андрей Петров
А когда у тебя виктория и там несколько кластеров льёт метрики
Не очень понял проблематики
источник

АП

Андрей Петров... in Церковь метрик
У тебя есть up{job=node_exporter,  cluster=cluster1}, up{job=node_exporter,  cluster=cluster2} и тд
Соответственно absent(up{job=node_exporter}) не прокатит
источник

EB

Eugene Bosiakov in Церковь метрик
Андрей Петров
У тебя есть up{job=node_exporter,  cluster=cluster1}, up{job=node_exporter,  cluster=cluster2} и тд
Соответственно absent(up{job=node_exporter}) не прокатит
потому что нужно по инстансам делать
источник

EB

Eugene Bosiakov in Церковь метрик
На каждую ноду свой алерт
absent(up{job=node_exporter, instance=node1})
источник

АП

Андрей Петров... in Церковь метрик
Вот так не очень хочется
источник

АП

Андрей Петров... in Церковь метрик
Перечислять для каждого кластера
источник