m2 вполне может в три потока плотить. В зависимости от того, какой m2, то даже и в четыре, пожалуй. Время, конечно, будет варьироваться в большую сторону. Зато сразу все вместе.
Чтобы правильно это делать, нужно провести замеры именно для своей системы для всех четырёх фаз. Посмотреть как именно в вашей системе идут графики утилизации цпу, памяти и дисков. Найти бутылочные горлышки для всего железа во всех фазах.
Затем использовать шедулер, который настроить на запуск плотов так, чтобы в бутылочных горлышках они пересекались минимально. Либо самому написать скриптик, либо использовать plotman.