Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была
Так чтоб им этот датасет в 10 Гб собрать, подчас надо несколько теров перелопатить со всякой экзотической логикой) это, мб, больше про ненужность мллиб, хотя я тут не в теме.