относительно флуда про бэкапы, рискуя начать холивар, считаю что миррор основного хранилища (которое уже 3-way replica с локальными снэпами за 7 дней) на географически удаленный бэкап и 7+4+12 снэпшоты на год назад на бэкап кластере - это адекватно. Работало 10+ лет на ZFS, на Nexenta, на NetApp. В параноидальных случаях - на тэйп через библиотеку и на полку раз в квартал.
Когда количество файлов превышает 50-100 миллионов, и общий объем в радиусе петабайта, бэкапить как-то еще кроме отправки дельты блоков становится сложно.
При восстановлении любой снэп клонируется и монтируется рид-онли за 2 минуты скриптами без задействования даже 2-ой линии супорта. Ну это уже логистика, tldr.
Дело не в кривых руках а в 99.999% аптайме и в 24/7 нагрузках с очень небольшими окнами под служебные нагрузки.