Size: a a a

Церковь метрик

2021 January 25

В

Вадим in Церковь метрик
справа график rps
источник

S

Solresl in Церковь метрик
Обычно задача вроде не понять где больше запросов, а что основная масса обработана быстрее чем x.

Разве нет?
источник

В

Вадим in Церковь метрик
Solresl
Сделайте больше бакетов если считаете этой инфы вам мало.

Не понятно чего вы хотите добиться?

Heatmap сделайте
баккетов то я наплодил
requestDurationHistogramBuckets: [0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 1, 2.5, 5, 10],
источник

В

Вадим in Церковь метрик
Solresl
Обычно задача вроде не понять где больше запросов, а что основная масса обработана быстрее чем x.

Разве нет?
этого мало - обычно нужно понимать как меняется latency после релиза для основной массы а она может и не выходить за установленные границы но существенно сдвигаться в этом диапазоне а мы этого не видим и не понимает стало лучше или хуже
источник

S

Slach in Церковь метрик
Вадим
это нагрузочное тестирование по корневому урлу
GET /  инфу откуда собирает?
что кешируется?
это только HTML или это JSON

дальше делается инструментирование кода и подсчет латенси на конкретных участках кода
или семплирующий CPU профайлинг по которому строится flamegraph ищется на нем узкие места
источник

S

Slach in Церковь метрик
Вадим
баккетов то я наплодил
requestDurationHistogramBuckets: [0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 1, 2.5, 5, 10],
покажите картинку с этими бакетами
источник

В

Вадим in Церковь метрик
Slach
GET /  инфу откуда собирает?
что кешируется?
это только HTML или это JSON

дальше делается инструментирование кода и подсчет латенси на конкретных участках кода
или семплирующий CPU профайлинг по которому строится flamegraph ищется на нем узкие места
да это все понятно - тут только анализ работы сервиса  за assets отвечает nginx
источник

S

Slach in Церковь метрик
Вадим
этого мало - обычно нужно понимать как меняется latency после релиза для основной массы а она может и не выходить за установленные границы но существенно сдвигаться в этом диапазоне а мы этого не видим и не понимает стало лучше или хуже
если из бакетов не выбивается, то СТАЛО ТАКЖЕ, с точки зрения отзывчивости
чтобы стало лучше надо чтобы 50% и 90% персентили не расходились больше чем на 10%
источник

S

Slach in Церковь метрик
Вадим
баккетов то я наплодил
requestDurationHistogramBuckets: [0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 1, 2.5, 5, 10],
ну и покажите эту картинку то с бакетами?
источник

S

Solresl in Церковь метрик
Вадим
баккетов то я наплодил
requestDurationHistogramBuckets: [0.005, 0.01, 0.025, 0.05, 0.1, 0.25, 0.5, 1, 2.5, 5, 10],
Ну нарисуйте вывод сколько запросов в бакетах, если где-то будет больше будет же перетекать из одного в другой
источник

В

Вадим in Церковь метрик
Slach
если из бакетов не выбивается, то СТАЛО ТАКЖЕ, с точки зрения отзывчивости
чтобы стало лучше надо чтобы 50% и 90% персентили не расходились больше чем на 10%
я же написал - может и не выходить за установленные границы но как и НАТО может угрожающе вдруг вся масса приблизится к этим границам 🙂 война на пороге - а мы в однополых кафтанах! 😁
источник

В

Вадим in Церковь метрик
ребята ну хоть бы поделились своими графиками - может действительно я бы глянул и сказал - во! так все ж понятно! 😁
источник

S

Solresl in Церковь метрик
Звучит как вы сами не понимаете, что хотите) имходите из задачи, а не то что по картинкам понравится
источник

S

Slach in Церковь метрик
Вадим
ребята ну хоть бы поделились своими графиками - может действительно я бы глянул и сказал - во! так все ж понятно! 😁
https://www.youtube.com/watch?v=sbg4isaWQfo
там ссылка на презу есть в первом комменте
источник

S

Slach in Церковь метрик
оно старое очень, многие вещи сейчас сделал бы по другому  и на другом стеке
источник

S

Slach in Церковь метрик
лучше презу смотреть наверное
источник

В

Вадим in Церковь метрик
Slach
оно старое очень, многие вещи сейчас сделал бы по другому  и на другом стеке
спасибо - посмотрю
источник

S

Slach in Церковь метрик
там вроде бы на слайдах было три графика
первый бакеты по проекту в целом
второй бакеты по сервисам в проекте
третий "опасный класс" по инструментированным кускам кода...

требования по трешхолдам рассчитываются из каких то объективных показателей типа Concurrent Users + 90% latency
источник

В

Вадим in Церковь метрик
подскажите еще из опыта эксплуатации какой оптимальный интервал сбора метрик на загруженных сервисах?
источник

SC

Smoked Cheese in Церковь метрик
какое вам разрешение надо - такое и ставьте
источник