Size: a a a

2020 September 05

i

inqfen in AWS_RU
Мастер-то чего?
источник

S

Something in AWS_RU
inqfen
И какой у тебя мониторинг тоже не знаю
что app работает. А с машин почти ничего не собирается, что нужно собирать? Добавим
источник

S

Something in AWS_RU
приложения
источник

i

inqfen in AWS_RU
Something
что app работает. А с машин почти ничего не собирается, что нужно собирать? Добавим
Ну хотя бы минимально сислог
источник

S

Something in AWS_RU
самописное
источник

i

inqfen in AWS_RU
Ну и мониторинг конечно изнутри нужен
источник

i

inqfen in AWS_RU
Тот же пром и нод экспортеры на машины
источник

KT

Karen Tovmasyan in AWS_RU
Something
оно как бы не смертельно, но если вылетает мастер - надо потом проверять что ничего не сломалось
Так у вас тачка умирает
источник

KT

Karen Tovmasyan in AWS_RU
Отказ по статусу, это уже лоу левел штуки
источник

i

inqfen in AWS_RU
Может у тебя мастер выедает память, oom не успевает и система раком встаёт
источник

KT

Karen Tovmasyan in AWS_RU
Ковыряйте стрейс
источник

KT

Karen Tovmasyan in AWS_RU
inqfen
Тот же пром и нод экспортеры на машины
++
источник

KT

Karen Tovmasyan in AWS_RU
Асг просто делает свою роботу
источник

S

Something in AWS_RU
inqfen
Может у тебя мастер выедает память, oom не успевает и система раком встаёт
нет, память-проц-диск-своп отслеживаются через CloudWatch, тут всё ок
источник

i

inqfen in AWS_RU
Something
нет, память-проц-диск-своп отслеживаются через CloudWatch, тут всё ок
Context switching отслеживается?
источник

S

Something in AWS_RU
нет
источник

i

inqfen in AWS_RU
Значит считай что cpu не отслеживается)
источник

i

inqfen in AWS_RU
При высоком context switching может быть низкая утилизация, а машина по факту практически не работает
источник

KT

Karen Tovmasyan in AWS_RU
Something
нет, память-проц-диск-своп отслеживаются через CloudWatch, тут всё ок
Кв агент стоит на машине?
источник

S

Something in AWS_RU
да
источник