Size: a a a

Церковь метрик

2021 August 05

k

kvaps in Церковь метрик
Аномалий по сети и дисковой подсистеме нету
источник

AZ

Alexey Zakharov in Церковь метрик
Компьютер ничего не делал, а потом какой-то процесс как сделал
источник

AT

Alexander Tataurov in Церковь метрик
какой пейлоад у ноды-то?
источник

AT

Alexander Tataurov in Церковь метрик
inb4 голая убунта, а на скриншоте запуск unattended-upgrades
источник

k

kvaps in Церковь метрик
Чуваки частично рубанули питание в ДЦ и часть нод начала в OOM выпадать, почему непонятно.
Первый раз такое вижу.
источник

k

kvaps in Церковь метрик
Обычно виноват какой-нибудь  iowait или сбои в сети, сейчас же вообще ничего
источник

GM

Gleb Mekhrenin in Церковь метрик
у вас цефянка
источник

AT

Alexander Tataurov in Церковь метрик
1. Что на нодах? Приложения, нжинкс, постгресы, прометеус, виктория, инфлакс, чёрт лысый?
2. Виртуалки? Vmware, kvm, ксен, что там ещё нынче
3. Вам скорее в любой другой чат по администрированию линуксов в целом
источник

A

Andrey in Церковь метрик
цеф или чето подобное есть? Рубанули часть нод, началось восстанвовление
источник

AZ

Alexey Zakharov in Церковь метрик
Какая-то связь очень неявная, часть серверов погасла, а другая часть начала жрать проц и память? А что за софт-то там?
источник

TF

Terry Filch in Церковь метрик
источник

GM

Gleb Mekhrenin in Церковь метрик
похоже на попытку сделать гиперконвернгенцию на цефе 🙂
источник

TF

Terry Filch in Церковь метрик
часть нод, это случаем не связано с кластерами этих нод?
источник

k

kvaps in Церковь метрик
Апач и похапе в кубе крутятся, сторадж отдельный по iscsi подключён, судя по логам сторадж не отваливался
источник

k

kvaps in Церковь метрик
Хм, похоже проблема была всё же с подключением.
Часть процессов не смогла достучаться до бд и в итоге начали валиться в OOM
источник

k

kvaps in Церковь метрик
занятно, пойду искать оригинальную проблему, всем спасибо :)
источник

AZ

Alexey Zakharov in Церковь метрик
Такое косвенно по графикам tcp-сессий можно увидеть, скорее всего
источник

k

kvaps in Церковь метрик
бинго!
источник

AZ

Alexey Zakharov in Церковь метрик
А по количеству сессий будет провал, вероятно
источник

AZ

Alexey Zakharov in Церковь метрик
у нод экспортера node_netstat_Tcp_CurrEstab, есть ещё полезная тема node_netstat_Tcp_ActiveOpens и node_netstat_Tcp_PassiveOpens — на них видно флап сессий
источник