Народ. Подскажите. Как мне прочитать и сджойнить огромный набор непартийированных данных. Шаффлинг зашкаливает. Пока приходит в голову только считать и пересохранить все это партицированно . Только боюсь что прочитать и сохранить не получится изза обьемов
А формат исходных данных позволяет их читать частями?