Size: a a a

Церковь метрик

2020 May 01

AK

Andrey Kartashov in Церковь метрик
До компа доберусь
источник

BD

Banschikov Denis in Церковь метрик
Andrey Kartashov
До компа доберусь
🤝
источник

A

Alexander in Церковь метрик
Всем привет! Пытаюсь отладить доставку сообщений из alertmanager в opsgenie. Большинство проходит, но иногда
component=dispatcher msg="Notify for alerts failed" num_alerts=13 err="cancelling notify retry for \"opsgenie\" due to unrecoverable error: unexpected status code 422: {\"message\":\"Request body is not processable. Please check the errors.\",\"errors\":{\"priority\":\"should be one of [ P1, P2, P3, P4, P5 ]\"}


Как отладить - не понимаю.
источник

A

Alexander in Церковь метрик
Вот например почему num_alerts=13? В веб интерфейсе alertmanager не вижу таких больших пачек запросов одновременно. Да и вообще группировка отключена: group_by: ['...']
источник

GM

Gleb Mekhrenin in Церковь метрик
группировка тебя как раз и спасает от спама
источник

A

Alexander in Церковь метрик
Группировка - добро, но назад я её включать буду только добившись стабильности в доставке сообщений.
источник

GM

Gleb Mekhrenin in Церковь метрик
Gleb Mekhrenin
группировка тебя как раз и спасает от спама
но 422, это не 429 так что дело именно в том что ты туда шлешь
источник

A

Alexander in Церковь метрик
Вооот! И как посмотреть, что я шлю?
источник

A

Alexander in Церковь метрик
--log.level=debug не показывает
источник

GM

Gleb Mekhrenin in Церковь метрик
Alexander
Вооот! И как посмотреть, что я шлю?
поставить вместо урлы опс джини что-нибудь принимающее вебхуки например  Но скорее всего дело в опциях алертменеджера там были изменения в синтаксиса конфигурации, покажи кусок конфига и версию ам
источник

A

Alexander in Церковь метрик
alertmanager 0.20.0
источник

GM

Gleb Mekhrenin in Церковь метрик
в теории можно сюда отправлять алерты https://webhook.site/
источник

GM

Gleb Mekhrenin in Церковь метрик
ну или локально что то подобное поставить
источник

A

Alexander in Церковь метрик
receivers:
- <hidden>
- name: opsgenie
 opsgenie_configs:
 - api_key: <hidden>
   message: <...> {{ template "opsgenie.default.message" . }}
   priority: '{{ range .Alerts }}{{ .Labels.priority }}{{ end }}'
   source: prometheus
   tags: prometheus,<hidden>,{{ range .Alerts }}{{ .Labels.tags }},{{ end }}
источник

AN

Artem Navoiev in Церковь метрик
priority: '{{ range .Alerts }}{{ .Labels.priority }}{{ end }}' проблему вот тут
источник

AN

Artem Navoiev in Церковь метрик
отслыает когда 1 алерт не отсылает когда больше чем 1
источник

AN

Artem Navoiev in Церковь метрик
потому что будет priority: P1P1P1 ...
источник

GM

Gleb Mekhrenin in Церковь метрик
навскидку еще легко может быть проблема с "tags" там бывают в апи изменения, чуть раньше teams переделали например
источник

A

Alexander in Церковь метрик
Artem Navoiev
priority: '{{ range .Alerts }}{{ .Labels.priority }}{{ end }}' проблему вот тут
Так, это я вижу. Починить не удаётся:
1) Пытаюсь оторвать группировку (group_by: ['...']) — проблема остаётся
источник

AN

Artem Navoiev in Церковь метрик
```
 priority: '{{ .Alerts[0].Labels.priority }}'
   source: prometheus
   tags: {{ range .Alerts }}{{ .Labels.tags }},{{ end }},prometheus,<hidden>

```
источник