все равно непонятно (поэтому и полез разбираться): спарк пишет всегда в другую директорию и потом "атомарно" ее переименовывает. Это вроде как изначальная идея, над которой долго бился HDFS и которую не очень просто повторяют объектный стораджа. Поэтому (как я думал и пока остался при своем) при записи (будь то append, будь то overwrite) файлы появляются разом...
Либо в описанной ситуации что-то сложнее (я услышал слово merge, которое в случае overwrite мне не очень понятно), либо - наоборот - что-то сильно проще.
В моем примере мне на overwrite вообще не поймать: цикл записи заканчивается "записью", а начинается с overwrite (=удалить все), поэтому читатель тупо таблички вообще не видит (ибо ее нет, удалить писатель ее удалил, а новые данные "налить" еще не успел)
Мне интересно понять (для себя), дайте знать, если я зря это здесь... я не со зла 😊