Как таковой документации ты не найдешь, есть менеджер которому надо знать все ли ок или все хреново, делаешь DA добавляешь только то что действительно отображает состояние системы без излишеств: error event, performance и тд. Для порталов например делаю web App transaction где проверяю текст страниц, если текста нет и ответ не 200 то все печально
Ну соответственно, то что на платформе творится отдельно обговаривается с админами и владельцами, самый приметивный и тупой способ борьбы с админами спамить их ошибками через письма, заявки, включая в копию руководителя
Ну за последние время коллега настроили портал, где админ или юзер делает запрос на ресурс, а именно сервер (vm), создаётся таска на установку, настройку, устраните уязвимостей, в том числе и млниторинг
Что касается изменения текущих пара метров, то по дефолту перф вырубаю, создаю таски на конфигурацию и доступность и пишу что сервер не работает и статус критикал) это всех раздражает+локальные бороды для хелп деска, помогают генератора таски что ничего не работает)
Ребят, хотел все спросить у кого как отстроен процесс внутри IT по настройке мониторинга? А так же если не секрет, сколько человек занимается мониторингом?
Администрирование - 1. Обратка алертов - 6. Утром получаем отчёт и каждый отрабатывает Алерты в своей зоне ответственности