Size: a a a

2020 September 05

KT

Karen Tovmasyan in AWS_RU
Something
у нас опять одна из нод в ASG самовольно перешла в terminated. Насколько это нормально? В CloudTrail я вижу только 1 событие с
               {
                   "instanceId": "i-0c049dd1d9c6efae1",
                   "currentState": {
                       "code": 32,
                       "name": "shutting-down"
                   },
                   "previousState": {
                       "code": 16,
                       "name": "running"
                   }
               }
но ничего - о причинах
А посмотрите логи асг
источник

i

inqfen in AWS_RU
Something
у нас опять одна из нод в ASG самовольно перешла в terminated. Насколько это нормально? В CloudTrail я вижу только 1 событие с
               {
                   "instanceId": "i-0c049dd1d9c6efae1",
                   "currentState": {
                       "code": 32,
                       "name": "shutting-down"
                   },
                   "previousState": {
                       "code": 16,
                       "name": "running"
                   }
               }
но ничего - о причинах
Не спот?
источник

S

Something in AWS_RU
inqfen
Не спот?
нет
источник

i

inqfen in AWS_RU
А так мне выключали ноды из-за проблем на железе
источник

i

inqfen in AWS_RU
Там где-то есть что-то типа changing state reason или как-то так, не помню точно
источник

S

Something in AWS_RU
Description:DescriptionTerminating EC2 instance: i-0c049dd1d9c6efae1
Cause:CauseAt 2020-09-05T11:00:40Z an instance was taken out of service in response to a EC2 instance status checks failure.
источник

S

Something in AWS_RU
Karen Tovmasyan
А посмотрите логи асг
пока всё что нашёл. Есть где-то более подробно, какие проверки не прошли?
источник

i

inqfen in AWS_RU
А, ну машина перестала чеки проходить, смотри с неё логи
источник

KT

Karen Tovmasyan in AWS_RU
Something
Description:DescriptionTerminating EC2 instance: i-0c049dd1d9c6efae1
Cause:CauseAt 2020-09-05T11:00:40Z an instance was taken out of service in response to a EC2 instance status checks failure.
Ну вот
источник

KT

Karen Tovmasyan in AWS_RU
Something
пока всё что нашёл. Есть где-то более подробно, какие проверки не прошли?
Статус чек и есть проверка
источник

S

Something in AWS_RU
inqfen
А, ну машина перестала чеки проходить, смотри с неё логи
в логе который GetSystemLog - только про старт есть
источник

KT

Karen Tovmasyan in AWS_RU
Гостевая машина не отрапортавала статус гипервизрры
источник

S

Something in AWS_RU
просто не первый раз уже такое
источник

i

inqfen in AWS_RU
Something
в логе который GetSystemLog - только про старт есть
В логе который с неё собираешь
источник

i

inqfen in AWS_RU
Может по памяти накрылась
источник

S

Something in AWS_RU
оно как бы не смертельно, но если вылетает мастер - надо потом проверять что ничего не сломалось
источник

S

Something in AWS_RU
inqfen
В логе который с неё собираешь
можно подробнее?
источник

i

inqfen in AWS_RU
Something
можно подробнее?
А я не знаю как ты с машин логи собираешь, так что нельзя)
источник

i

inqfen in AWS_RU
И какой у тебя мониторинг тоже не знаю
источник

S

Something in AWS_RU
причём похоже что второй раз и опять мастер и вылетел.. если что это t3.medium
источник