Альтернативный вариант - таки запустить кол-во плоттеров равное количеству ядер процессора, дать ОДИН ТРЕД каждому. Будут простаивать во время записи на диск. но это гораздо проще, чем запускать их с рассинхроном.
Я тем временем добавил локинг защищающий от одновременной записи в файлы в Stage 1 при threads > 1, сейчас посмотрим есть ли какой-то выигрыш по скорости...