Size: a a a

Церковь метрик

2020 August 12

AS

Aleksey Shirokikh in Церковь метрик
Igor
а алертменеджеры не будут в такой конфигурации дублировать алерты разве?
Там есть протокол согласования кто будет отправлять алерт
источник

I

Igor in Церковь метрик
окей. посмотрю
источник

I

Igor in Церковь метрик
то есть алертменеджеры умеют в кластер собираться? круто
источник

AS

Aleksey Shirokikh in Церковь метрик
Igor
то есть алертменеджеры умеют в кластер собираться? круто
Ну я бы не стал называть это кластером. Они просто умеют договариваться об очеордности и задержках
источник

AN

Artem Navoiev in Церковь метрик
источник

I

Igor in Церковь метрик
респект! только хотел спросить, в какую сторону гуглить
источник

b

blkmrkt in Церковь метрик
Спасибо, почитаю про пимбу.

Тем временем заметил что только часть ивентов отображается в Графане. Ради теста вызывал вот это в цикле из Питона 100 раз, и запускал 16 раз сам скрипт с небольшими промежутками в т-ии часа:
for _ in range(0, 100): 
 statsd.incr('testing.increments')


Графана показывает 600 вместо 1600 по этому запросу: summarize(testing.increments, '1h', 'sum', false)

Сверил настройки MTU в bioyino, carbon-clickhouse и на сервере, везде 1500. Спайка дропнутых фреймов не замечаю, в чем может быть дело?
источник

b

blkmrkt in Церковь метрик
К слову, когда запускаю реальный скрипт который увеличивает счетчик 1000 раз, то такое чувство что до интерфейса Графаны доходят только 10% инкрементов счетчика. Логически пропорции ивентов такие же как я и ожидал, но суммы вообще и близко не дотягивают до тех которые реально должны быть.

Что там может дропать эти счетчики? Стек на пике, конфиги практически копипейст из репо от lomik.
источник

vk

vladimir kolobaev in Церковь метрик
blkmrkt
К слову, когда запускаю реальный скрипт который увеличивает счетчик 1000 раз, то такое чувство что до интерфейса Графаны доходят только 10% инкрементов счетчика. Логически пропорции ивентов такие же как я и ожидал, но суммы вообще и близко не дотягивают до тех которые реально должны быть.

Что там может дропать эти счетчики? Стек на пике, конфиги практически копипейст из репо от lomik.
мы гоняли тесты по 1 000 000 каунтеров батчами по 100 000 каждые 5 сек в 24 потока и в результате получали свою метрику рястянутую по времени с 1кк в сумме
источник

vk

vladimir kolobaev in Церковь метрик
У био есть собственные метрики, по ним хорошо видно сколько событий в него влетает и сколько метрик он из них генерирует. Даже статистикаа по префиксам есть, чтобы было понятно какой процесс/сервис начал отправлять миллионы метрик
источник

b

blkmrkt in Церковь метрик
vladimir kolobaev
У био есть собственные метрики, по ним хорошо видно сколько событий в него влетает и сколько метрик он из них генерирует. Даже статистикаа по префиксам есть, чтобы было понятно какой процесс/сервис начал отправлять миллионы метрик
спасибо, посмотрю что он там наотправлял
источник

b

blkmrkt in Церковь метрик
vladimir kolobaev
У био есть собственные метрики, по ним хорошо видно сколько событий в него влетает и сколько метрик он из них генерирует. Даже статистикаа по префиксам есть, чтобы было понятно какой процесс/сервис начал отправлять миллионы метрик
упс, что-то не сходится
источник

b

blkmrkt in Церковь метрик
blkmrkt
упс, что-то не сходится
Правильно ли я вижу, что тут влетают 100 incr('testing.increment'), он их агрегирует и на выхлоп дает incr('testing.increment', 100)?
источник

vk

vladimir kolobaev in Церковь метрик
blkmrkt
упс, что-то не сходится
что именно? к тебе прилетают события в количестве ~26к из которых генерится ~1k метрик
источник

vk

vladimir kolobaev in Церковь метрик
на графиках RPM?
источник

b

blkmrkt in Церковь метрик
vladimir kolobaev
на графиках RPM?
Не знаком с термином, сорри. Деш стандартный из вот этой связки форка lomik. Квери к ингресс графику такой: aliasByNode(resources.monitoring.bioyino.ingress*, 3)
источник

vk

vladimir kolobaev in Церковь метрик
blkmrkt
Не знаком с термином, сорри. Деш стандартный из вот этой связки форка lomik. Квери к ингресс графику такой: aliasByNode(resources.monitoring.bioyino.ingress*, 3)
подебажем что у тебя там в личке
источник

AS

Aleksey Shirokikh in Церковь метрик
Переслано от Artem Navoiev
good news everyone - https://github.com/VictoriaMetrics/operator открыт в публичный доступ,  проект рабочий но доработки напилньком требует (особенно доки)
благодарю @f41gh7 @k1rk_t за то что сделали это :) Тестирование и контрибьюшен очень привествуется
источник
2020 August 13

S

Slach in Церковь метрик
blkmrkt
Спасибо, почитаю про пимбу.

Тем временем заметил что только часть ивентов отображается в Графане. Ради теста вызывал вот это в цикле из Питона 100 раз, и запускал 16 раз сам скрипт с небольшими промежутками в т-ии часа:
for _ in range(0, 100): 
 statsd.incr('testing.increments')


Графана показывает 600 вместо 1600 по этому запросу: summarize(testing.increments, '1h', 'sum', false)

Сверил настройки MTU в bioyino, carbon-clickhouse и на сервере, везде 1500. Спайка дропнутых фреймов не замечаю, в чем может быть дело?
правильно пиНба ;) пиМба на носу или еще где нибудь вскочит если не правильно термины употреблять :)

checkbox extrapolate выключите в Grafana в query editor и идите в query inspector результаты сверять
ну и generated SQL посмотрите запустите его в clickhouse-client посмотрите результаты
источник

PR

Paul Rudnitskiy in Церковь метрик
о, в пинбу добавили CH, прикольно. Мы ее на MySQL гоняли, классная штукенция
источник