Вкину чуть-чуть. Надеюсь ни кто не против.
http://salimonov.com Там две статьи по HA и BC/DR. Буду признателен за критику, можно тут, можно в твиттер, можно в почту писать.
На подходе скоро третья, с вероятностями, статистикой и т.п.
После этого разбора буду BC/DR описывать из опыта и какие знания есть. Но просится ещё одна по метрикам-мониторингу и идентификации отказов.