так сколько активных соединений сможет вычитывать одновременно приложение на 8-ядерном проце?
А при чём тут активные треды?
Можно послать 100 запросов (по 4 одновременно), подождать их (блокируясь), и потом обработать 100 ответов (опять же, по 4 одновременно).
Если на latency пофигу, можно и в один поток работать.