pagerduty.comЛидер рынка, потому не стесняется в стоимости.
Хорошая документация (но не лучшая) по интеграциям. Интеграция в слак двусторонняя. Есть модуль для ansible, позволяющий запускать maintenance.
Работа строится на сервисах. Каждый сервис получает свои собственные каналы получения событий, собственные настройки эскалации и интеграции.
Автоматизация сортировок событий тоже строится на сервисах, это фрустрирует поначалу.
Вообще на фоне конкурентов pd проигрывает. Это самый простой сервис с минимальным функционалом. При этом за наибольшую стоимость.
victorops.comСервис строится вокруг ленты событий. В неё валится всё - переписки, алерты, сообщения от ботов.
Сервис очень хочет затащить ваши чаты по устранению проблемы в себя.
Отвратительная документация по интеграциям. Интеграция в слак позволяет только слать нотификашки в канал\юзеру. Понравилась идея alert transmogrifier - обрабатывать каждый эвент в соответствии с правилами поиска. Например если в имени сервера есть staging - то не алертим ночью или если в имени сервера есть jenkins и упал - то добавляем к сообщению ссылку на инструкцию по починке и вот эту картинку
Есть отчеты, их ценность понять не смог по причине отсутствия инцидентов.
Можно вести постмортемы на сервисе, добавляя таймлайн инцидента.
Хорошие удобные политики эскалации, управление командой.
opsgenie.comРабота строится на ручном или автоматизированном разборе ленты событий. Доступны теги, группировки, етс.
Море интеграций, хорошая документация (сильно лучше, чем у викторопс). Интеграция в слак двусторонняя, можно управлять алертами из слака.
Есть всё, что мне понравилось в victorops и даже больше.
Минус - очень много кнопочек, возможно будет трудно разобраться.