Привет. Вляпался в вопрос с зависающими миграциями. Может кто-то сталкивался/видел рецепт?
Newton.
На одной из нод openstack'a случился oom. После этого перестали нормально работать миграции. В том числе и для остальных нод. Перезапуск служб не помогает. По virsh list —all вижу, что инстансы приезжают на целевую ноду, однако в openstack повисает состояние migrating, в базе nova висят указания на исходную ноду, в neutron указания migrating to.
На исходной ноде в node-compute.log болтаются сообщения вида:
Migration operation has completed
Error monitoring migration: The server has either erred or is incapable of performing the requested operation. (HTTP 500)
Live migration failed.
VM Stopped (Lifecycle Event).
После чего периодически повторяющиеся
During sync_power_state the instance has a pending task (migrating). Skip.
При этом на целевой ноде
VM Resumed (Lifecycle Event)
During the sync_power process the instance has moved from host node5 to host node2.
Значения в базе конечно поправить можно (что я и делал), но это помогает ровно до первой лайв-миграции.
Рассинхроны фактического состояния инстансов и тем, что говорит openstack ловил и раньше, но то были случайные какие-то события. Здесь же какое-то повальное влияние на все тестовые инстансы.
С продакшн инстансами, скорее всего, будет то же самое.
Привет!
А что nova-compute на проблемном сервере? В нормальном состоянии? enabled/up?
Логи смотришь в дебаг режиме?
По твоему описанию ничего непонятно же пока. И, судя по тому, что никто не ответил сходу это не баг какой-то, а экзотическая ситуация. Поэтому без дебага никак.