Я планирую выступить с темой Testing Apache Spark Appreciations на Спарк саммит, перед этим хорошо переработать статьи и презентации, так что любые комментарии приветствуются.
Мне кажется стоит какой-то более убедительный ответ найти на вопрос: почему не docker. Потому что, нк по дефолту сейчас такие тесты делаются именно там.
Например, можно запускать в IDE, тесты проходят быстрее, можно найти root cause в дебаггере. Можно легко менять поведение настроек от теста к тесту. Можно мокать отдельные куски или менять их поведение специально для теста.