Size: a a a

Церковь метрик

2019 December 18

ДУ

Денис Устинов in Церковь метрик
Роман Зарипов
Я сервер метрик пишу, он собирает метрики с экспортеров и все их вместе выводит в /metric. Так вот, когда я в цикле запускаю, у меня "Duplicated timeseries in CollectorRegistry". Надо ли мне очищать CollectorRegistry перед тем, как туда данные добавлять или там какой-то другой механизм?
У Брайана есть пример, там вроде с несколькими метриками
источник

AA

Artyom Abramovich in Церковь метрик
а регать его можно только один раз)
источник

ДУ

Денис Устинов in Церковь метрик
Решай один раз и только значения туда пуляй
источник

РЗ

Роман Зарипов in Церковь метрик
Artyom Abramovich
а регать его можно только один раз)
Но у меня не на все метрики ругается.
источник

AA

Artyom Abramovich in Церковь метрик
Роман Зарипов
Но у меня не на все метрики ругается.
источник

РЗ

Роман Зарипов in Церковь метрик
Спасибо. Гляну.
источник

AS

Aleksey Shirokikh in Церковь метрик
тут про метрики
источник

АИ

Александр Ильющеня in Церковь метрик
Привет, всем!

Помогите понять, как работают настройки alertmanager group_wait, group_interval, repeat_interval.

Как я понимаю, по пришествию alert-а от Prometheus в alertmanager логика работы такова:
1. проверяется истек ли интервал repeat_interval - если нет, то alert считается resolved (разрешенным) и просто удаляется
2. проверяется истек ли интервал group_interval для группы, к которой относится alert - если нет, то alert добавляется в хранилище для этой группы и ждет, покуда интервал group_interval истечет, после чего выполняется отправка накопившихся alert-ов ответственному одним сообщением
3. проверяется истек ли интервал group_wait для группы, к которой относится alert - если нет, то alert добавляется в хранилище для этой группы и ждет, покуда интервал group_wait истечет, после чего выполняется отправка накопившихся alert-ов ответственному одним сообщением

Подскажите, правильно ли я понимаю?
источник

R

Rad in Церковь метрик
repeat_interval если я правильно помню это время через которое будет отправлена нотификация об алерте если тот не перешел в статус resolve
источник

АИ

Александр Ильющеня in Церковь метрик
а в статус resolve он переходит после того, как он перестает быть в статусе firing в прометее и в связи с этим прометей перестает отправлять алерт на алертменеджер?
источник

A

Andrey Afoninskiy in Церковь метрик
https://github.com/stripe/veneur у кого есть что сказать по этому поводу?
источник

AS

Aleksey Shirokikh in Церковь метрик
Звёздочек норм можно брать
источник

A

Andor in Церковь метрик
Aleksey Shirokikh
Звёздочек норм можно брать
Го в прод, я создал
источник

AS

Aleksey Shirokikh in Церковь метрик
Andor
Го в прод, я создал
Ты мне с прошлого такого раза ssh ключ забыл обновить
источник

MG

Max Garmash in Церковь метрик
Коллеги всем привет, подскажите плиз куда копнуть. Сегодня обсуждали с командой проблему мониторинга nginx и postgres при помощи prometheus.

Проблема такова: собираем метрики раз в 5 секунд. Происходит событие пиковое длительностью секунду-две и на графиках усредненных prometheus-ом этот пик очевидно может быть пропущен. Это может быть резкий скачок в нагрузке на хост запросами или в БД.
Есть ли какое-то решение? Собирать метрики локально (из access-логов например) и пушить напрямую в prometheus? Собирать обычным образом раз в секунду на мой взгляд не вариант, слишком накладно.
источник

A

Andor in Церковь метрик
собираешь агрегаты (гистограммы) и будет видно
источник

SC

Smoked Cheese in Церковь метрик
этот пик не может быть пропущен, если собираются каунтеры
источник

MG

Max Garmash in Церковь метрик
Можно чуть подробнее, почему? Если я правильно понимаю схему работы pull, то мы раз в 5 сек собираем текущие значения и можем пропустить таким образом? Нет?
источник

MG

Max Garmash in Церковь метрик
Или exporter надо настраивать собирать кумулятивно (как-то)?
источник

A

Andor in Церковь метрик
Max Garmash
Можно чуть подробнее, почему? Если я правильно понимаю схему работы pull, то мы раз в 5 сек собираем текущие значения и можем пропустить таким образом? Нет?
"текущие" это в вашем понимании что?
источник