Коллеги, добрый день.
Начал настраивать Prometheus + Grafana + Alertmanager для замены Zabbix + Grafana. И почти сразу возникло много вопросов:
1) То, что я вижу в :9182/metrics для машин с windows, это все доступные метрики? Как можно мониторить то, чего там нет? Например через zabbix я мог запускать скрипт на машине с Exchange, который возвращал количество писем в очереди и по этим данным строился график в Grafana. Прометей так может или нужно что-то дополнительное ставить? Мне советовали мониторить очередь через ELK, но не знаю лучший ли это вариант.
2) Нужен ли Telegraf, чтобы данные не терять в случае недоступности Прометея? Или он нужен только чтобы слать данные в InfluxDB?
3) Я нашёл одну готовую дашборду как раз по Exchange -
https://grafana.com/grafana/dashboards/4755, на скриншоте увидел часть вещей, которые хотел бы использовать. Но так как у меня нет InfluxDB, я его не могу использовать. Насколько вообще необходимо ставить InfluxDB? Смена базы расширяет функционал или как?
Извините если вопросы глупые, очень большой объем информации, сложно разобраться. Буду признателен если ещё посоветуете материалы по этой теме.