не обязательно иметь один persistent disk - лучше диск на каждый шард. Шардирование в данном случае как раз и обеспечит горизонтальное скалирование. Независимо можно отскейлить и vm-select сервисы, что тоже улучшит скорость чтения данных
Что делать если ВМ которая прикручена к шарду отвалится, повиснет сервер и т.п., до момента пока она не оживет я буду терять данные и 500тить клиентам?