в общем, команды rbd XXX отлипли, все образы видно, снова HEALTH_OK, но сплошные вопросы
1. Почему после возварщения последней ноды сразу HEALTH_OK, потом спустя минуту оказывается, что нет - у нас по факту около 1000 неактивных pg, у которых pg dump показывает только лишь номер, ни 1 активного osd, мастер osd = -1. И они ушли после рестарта OSD на нодах, которые побывали в ребуте. Но osd стартовали ж норм после ребута, 100% osd вернулось в строй. И их пришлось еще раз руками все по очереди рестартовать....
2. Или все таки влияло отсутствие последнего монитора в кворуме на это все....
3. 4 из 5 мониторов были в строю, 5 вернулся в кворум, на тех 4, что было показало clock skew ??? На величину, равную даунтайму этого последнего монитора в секундах. Хотя по логике, clock skew как раз таки на том, кто был в дауне.... И висело clock skew минут 5, до рестарта руками 1 из мониторов, хотя ntpd давно все время на нодах выровнял, буквально в течение минуты после загрузки...