Size: a a a

Церковь метрик

2020 July 27

AN

Artem Navoiev in Церковь метрик
немного biased, виктория метрикс на данный покрывает весь стэк в мониторинге, ей можно собирать, хранить алертить
источник

A

Andrey in Церковь метрик
Aleksey Shirokikh
Псс. ребята, а кто уже умеет в slo скажите, вы делите slo на "use case"? у меня есть продукт у которого две сильно разные точки входа. и выглядит будто каждую из точек входа стоит покрывать отдельными slo хотя sli будут примерно одни и теже.
Один из use case условно user faced и там критичны скорости ответов.
второй условно batch и там больше похоже больше критичен throughput
не скажу что мы умеем, и чисто субьективно, но у нас так - мы собираем метрики и шарим их другим тимам, и они строят свои SLO на них (маркетинговой команде нужны не такие как девелоперской, например)
плюс по ним же у нас SLA (пока планируется) клиентам - ну там стандартный лэтенси перцентиль и еррорейт
идея в том что мы предоставляем возможности, а пользуются ими как им надо для решения своих задач
источник

VS

Vladimir Smirnov in Церковь метрик
Aleksey Shirokikh
Псс. ребята, а кто уже умеет в slo скажите, вы делите slo на "use case"? у меня есть продукт у которого две сильно разные точки входа. и выглядит будто каждую из точек входа стоит покрывать отдельными slo хотя sli будут примерно одни и теже.
Один из use case условно user faced и там критичны скорости ответов.
второй условно batch и там больше похоже больше критичен throughput
я б сказал что имеет смысл объединить SLO если это один и тот же API, а если это две прям разных точки входа то можно и разделить, просто есть хороший шанс что алертить оно будет одномоментно, если у тебя реально это одно и то же
источник

AS

Aleksey Shirokikh in Церковь метрик
Vladimir Smirnov
я б сказал что имеет смысл объединить SLO если это один и тот же API, а если это две прям разных точки входа то можно и разделить, просто есть хороший шанс что алертить оно будет одномоментно, если у тебя реально это одно и то же
я опасаюсь что user faced путь при этом не будет алертить
источник

VS

Vladimir Smirnov in Церковь метрик
Aleksey Shirokikh
я опасаюсь что user faced путь при этом не будет алертить
Почему?
источник

AS

Aleksey Shirokikh in Церковь метрик
Vladimir Smirnov
Почему?
путь сильно отличается и я думал брать sli для него с ingress
источник

AS

Aleksey Shirokikh in Церковь метрик
ибо только там по факту у меня есть информация о латенси
источник

AS

Aleksey Shirokikh in Церковь метрик
в самом сервисе нет латенси ни в каком виде
источник

AS

Aleksey Shirokikh in Церковь метрик
но жопа в том что user faced:
а) не идемпотентный.
б) мало трафика.
источник

VS

Vladimir Smirnov in Церковь метрик
Aleksey Shirokikh
путь сильно отличается и я думал брать sli для него с ingress
вопрос скорее в том, у тебя код за это отвечает один или разный и если разный, достаточно ли далеко у них пересечение.
источник

AS

Aleksey Shirokikh in Церковь метрик
далеко.
если бы оно было микросервисами у них даже база была бы разная
источник

VS

Vladimir Smirnov in Церковь метрик
Aleksey Shirokikh
ибо только там по факту у меня есть информация о латенси
ну и тебе с user faced latency аккуратно надо быть, ну сам понимаешь почему
источник

A

Andor in Церковь метрик
Aleksey Shirokikh
далеко.
если бы оно было микросервисами у них даже база была бы разная
"даже"? :)
источник

VS

Vladimir Smirnov in Церковь метрик
Aleksey Shirokikh
далеко.
если бы оно было микросервисами у них даже база была бы разная
тогда сделай разные SLO, потому что есть шанс что одному будет норм, а другому поплохеет
источник

vk

vladimir kolobaev in Церковь метрик
Aleksey Shirokikh
но жопа в том что user faced:
а) не идемпотентный.
б) мало трафика.
А в чем проблема из 2х этих slo сделать бинарное представление - сооветствует требованиям/не соответствует требованиям -> объеденить в группу серий, из которой взять минимальное значение в каждый конкретный момент времени. Соответственно от 100% ОК отнимаешь N% не ОК и получаешь значение SLA за интересующее окно.
источник

AS

Aleksey Shirokikh in Церковь метрик
vladimir kolobaev
А в чем проблема из 2х этих slo сделать бинарное представление - сооветствует требованиям/не соответствует требованиям -> объеденить в группу серий, из которой взять минимальное значение в каждый конкретный момент времени. Соответственно от 100% ОК отнимаешь N% не ОК и получаешь значение SLA за интересующее окно.
это ты про другое. такой проблемы нет как наверное и задачи
источник

BB

Bral Bral in Церковь метрик
Как быть с кирилическими метриками? прометей выдает ошибку декодирования ? Я как понимаю, судя по гитхабу, проблема уже давно такая и решать как-то не спешат
источник

z

z311 in Церковь метрик
Bral Bral
Как быть с кирилическими метриками? прометей выдает ошибку декодирования ? Я как понимаю, судя по гитхабу, проблема уже давно такая и решать как-то не спешат
Ну если оно правда нужно, base64 есть для славян и индусов с цыганами.
источник

z

z311 in Церковь метрик
Ава классная у тебя, подрабатываешь? :)
источник

BB

Bral Bral in Церковь метрик
z311
Ну если оно правда нужно, base64 есть для славян и индусов с цыганами.
хотелось собирать с найфая - PrometheusReportTask , но увы в тракте все описания на русском языке=/
источник