Size: a a a

Церковь метрик

2019 November 30

GG

George Gaál in Церковь метрик
полностью переписать деплой и манифесты
источник

A

Anatoliy in Церковь метрик
Кстати, так, чисто случайно, никто podman не пробовал?
источник

AS

Aleksey Shirokikh in Церковь метрик
Anatoliy
теперь осталось понять как из сварма перейти на него и будет совсем хорошо
Kompoze
источник

AS

Aleksey Shirokikh in Церковь метрик
Это вообще куда нить в кубернетис чат. Тут про метрики
источник

A

Anatoliy in Церковь метрик
Тоже верно, прошу прощения)
источник

A

Andor in Церковь метрик
Aleksey Shirokikh
Куб но на локалхост
microk8s?
источник

AS

Aleksey Shirokikh in Церковь метрик
Andor
microk8s?
Тысячи их. Мне microk8s зашёл как лаба. А k3s типа для не самой критичной задачки.
источник
2019 December 01

C

Combot in Церковь метрик
Alert! Bob Bigsby is a known spammer and is CAS banned. Ban is strongly recommended.
источник

AG

Alexey Gusarov in Церковь метрик
Всем привет.

Не хватает понимания как собирать метрики с удалённых площадок.

Есть несколько датацентров раскиданых по миру. В каждом дц есть несколько виртуалок с web-сервисами и просто сервисами (это винда), в перспективе будет кубер.
По прикидкам на каждом дц будет собираться ~500 метрик.

Есть ещё один дц, там тоже несколько виртуалок с сервисами управления всем этим хозяйством.

Хочется собирать все метрики в центр и там принимать решение об алертинге и т.п.

Вижу несколько вариантов:
1. Prometheus в центре, и на каждом ДЦ с web-сервисами тоже prometheus. Дальше настроить федерацию и собирать.
 Из плюсов:
 -  всё уже придумано
 Из минусов:
 - каналы связи не всегда дают возможность достучаться до ДЦ
 - prometheus не поддерживает аутентификацию, нужно будет придумывать что-то перед ним

2. Prometheus в центре, на веб-сервисных ДЦ метрики пушить в Azure EventHub (кто не знает, это типа кафки), в центре принимать метрики из EventHub и пушить в Prometheus.
 Из минусов:
 - городить костыль.
 Из плюсов:
 - доступ к своим региональным azure есть из всех регионов и он получше, чем наши каналы связи.
 - судя по всему похожий механизм  всё равно нужен будет для передачи трассировок и логов в центр, так что плюсом будет являться единый механизм для передачи данных.


Может есть идеи получше?
источник

T

Tamerlan in Церковь метрик
Alexey Gusarov
Всем привет.

Не хватает понимания как собирать метрики с удалённых площадок.

Есть несколько датацентров раскиданых по миру. В каждом дц есть несколько виртуалок с web-сервисами и просто сервисами (это винда), в перспективе будет кубер.
По прикидкам на каждом дц будет собираться ~500 метрик.

Есть ещё один дц, там тоже несколько виртуалок с сервисами управления всем этим хозяйством.

Хочется собирать все метрики в центр и там принимать решение об алертинге и т.п.

Вижу несколько вариантов:
1. Prometheus в центре, и на каждом ДЦ с web-сервисами тоже prometheus. Дальше настроить федерацию и собирать.
 Из плюсов:
 -  всё уже придумано
 Из минусов:
 - каналы связи не всегда дают возможность достучаться до ДЦ
 - prometheus не поддерживает аутентификацию, нужно будет придумывать что-то перед ним

2. Prometheus в центре, на веб-сервисных ДЦ метрики пушить в Azure EventHub (кто не знает, это типа кафки), в центре принимать метрики из EventHub и пушить в Prometheus.
 Из минусов:
 - городить костыль.
 Из плюсов:
 - доступ к своим региональным azure есть из всех регионов и он получше, чем наши каналы связи.
 - судя по всему похожий механизм  всё равно нужен будет для передачи трассировок и логов в центр, так что плюсом будет являться единый механизм для передачи данных.


Может есть идеи получше?
я бы сначала попробовал федерацию - оно проще, если не будет устраивать, то можно уже костыли доставать

если позволяет среда, то аутентификацию можно заменить ограничением на подключение к порту с определённых адресов
источник

T

Tamerlan in Церковь метрик
да и сетевые задержки/иные проблемы - региональный пром всё равно будет собирать у себя, а центр должен подцепить в любом случае, пусть даже и с небольшими задержками
источник

GG

George Gaál in Церковь метрик
Alexey Gusarov
Всем привет.

Не хватает понимания как собирать метрики с удалённых площадок.

Есть несколько датацентров раскиданых по миру. В каждом дц есть несколько виртуалок с web-сервисами и просто сервисами (это винда), в перспективе будет кубер.
По прикидкам на каждом дц будет собираться ~500 метрик.

Есть ещё один дц, там тоже несколько виртуалок с сервисами управления всем этим хозяйством.

Хочется собирать все метрики в центр и там принимать решение об алертинге и т.п.

Вижу несколько вариантов:
1. Prometheus в центре, и на каждом ДЦ с web-сервисами тоже prometheus. Дальше настроить федерацию и собирать.
 Из плюсов:
 -  всё уже придумано
 Из минусов:
 - каналы связи не всегда дают возможность достучаться до ДЦ
 - prometheus не поддерживает аутентификацию, нужно будет придумывать что-то перед ним

2. Prometheus в центре, на веб-сервисных ДЦ метрики пушить в Azure EventHub (кто не знает, это типа кафки), в центре принимать метрики из EventHub и пушить в Prometheus.
 Из минусов:
 - городить костыль.
 Из плюсов:
 - доступ к своим региональным azure есть из всех регионов и он получше, чем наши каналы связи.
 - судя по всему похожий механизм  всё равно нужен будет для передачи трассировок и логов в центр, так что плюсом будет являться единый механизм для передачи данных.


Может есть идеи получше?
а почему не алертить с региональных дц?
источник

GG

George Gaál in Церковь метрик
поясняю. Предположим, у вас нарушилась связность между ДЦ, но при этом оба ДЦ работают. В региональном падает сервис - алерта в Вашей топологии не будет
источник

GG

George Gaál in Церковь метрик
т.е. центральный пром нужен только лишь для двух вещей
1. централизованное хранение метрик, а дальше передавать их в какое-то хранилище для статистики
2. алертинг, в случае, если накрылись каналы до региональных ДЦ или они попросту отключились
источник

AG

Alexey Gusarov in Церковь метрик
George Gaál
а почему не алертить с региональных дц?
они вне всей нашей инфраструктуры, сходу кажется сложно организовать алертинг с тех площадок. Но вопрос хороший, может и действительно можно так организовать. Я подумаю над этим.
источник

GG

George Gaál in Церковь метрик
сорри. У меня в башке щелкнуло. Гусаров. Ажур. Мы знакомы? Нет. вряд ли )
источник

GG

George Gaál in Церковь метрик
совпадение
источник

AG

Alexey Gusarov in Церковь метрик
George Gaál
поясняю. Предположим, у вас нарушилась связность между ДЦ, но при этом оба ДЦ работают. В региональном падает сервис - алерта в Вашей топологии не будет
Обычно если связность прям совсем нарушилась, то мы регион убираем из раздачи.
Т.е. остро такая проблема не стоит.
источник

AG

Alexey Gusarov in Церковь метрик
George Gaál
т.е. центральный пром нужен только лишь для двух вещей
1. централизованное хранение метрик, а дальше передавать их в какое-то хранилище для статистики
2. алертинг, в случае, если накрылись каналы до региональных ДЦ или они попросту отключились
Ещё и хочется всю систему видеть в одном месте.
источник

AG

Alexey Gusarov in Церковь метрик
George Gaál
сорри. У меня в башке щелкнуло. Гусаров. Ажур. Мы знакомы? Нет. вряд ли )
Это наверное ты про Владимира Гусарова :) Он рассказывает много про TFS и т.п.
источник