Но основной вопрос, на чем основывается заявление Виталия про то, что спарк больше 1-2 ТБ не посчитает?
Виталий сейчас в jetbrains, но у нас много сделал и сейчас сотрудничаем. В целом утверждение в общей форме неверно. Т.е. Какие-то кейсы на 2 тб влет работают, типа агрегаты и даже грамотные джоины, в каких-то, например если нужен мл, приходится попотеть.