Привет. Подскажите что почитать. Есть реализованный на pyspark пайплайн, в виде набора функций py, на выходе каждой функции структура питона и фрейм спарка, хочется при падении сессии и кластера, перезапустить расчеты с последнего удачного шага пайплайна. Можно например питоновскую структуру пиклить, а спарк фрейм сохранять на с3, и при новом запуске чекать, так сказать чекпоинты. Есть для этого готовые инструменты, чтобы не городить велосипед? Кстати, я так понял чекпоинты над рдд смысла использовать нет, если у тебя хдфс вместе с кластером с нуля рестартуют. (AWS EMR)