Коллеги, привет, кто нибудь реализовал у себя автоэвакуацию машин при падении хоста?
В свое время, мы тестировали pacemaker/corosync на ubuntu/centos и отказались от автоэвакуации на их основе. У нас решение начинает автоэвакуацию после проверки статусов компьюты через endpoint и подтверждения отсутствия "heartbeat" ноды по сети, идет проверка двух критериев. Сделали автоматический фенсинг на уровне ceph через blacklists по ttl, для обеспечения ha компонента принимающего решение об эвакуации используется кворум для выбора лидера, решение стабильно работает на разных дистрибутивах, выкатили нескольким клиентам, работает нормально.