Не понял, что этот вопрос делает на канале про компиляторы. Но да: сначала форкаем, чтобы у других потоков тоже появилась возможность поработать, потом делаем своё. Штатно на параллельном пути тупо всё форкнуть и тупо всё джойнуть, а там уж FJP пусть сам на одном из join'ов дойдёт до последовательного вычисления. Иначе толку от такой параллелизации нет. Или я просто не понял вопроса.
то есть, смотри, я крестовик если что, вот пусть у нас есть задача посчитать сумму 80 чисел, тогда в методе экзекат у задачи мы создаем 8 подзадач размерностью по 10 чисел в каждой. И считаем сумму там, а затем дождавшись все 8 подзадач, делаем сумму их результатов. Но, вот эти 8 подзадач будут доступны на исполнение, только после того как мы сделаем полное разбитие? Или мы можем сначала получить одну подзадачу и сразу начать ее выполнять другим потоком, который ее украдет и т. д?