если проц загрузят на 100, то вариант, параллелится там только 1-я фаза
еще можно запустить например 13 плотов по 2 потока, а после первой фазы еще 13 плотов по 2 потока (получится больше тредов, чем тредов проца, но не страшно) и посмотреть не будет ли так быстрее