У тебя есть таймслоты на каждом ядре (или потоке), которые разделены между гостями. Если ты нарезал vCPU больше чем у тебя есть ядер/потоков, то на активных потребителях видны задержки, это гость ждёт когда гипервизор поставит в очередь его требуемые таймслоты.
В итоге можно оказаться так, что хост с 4 потоками лучше обслужит двух гостей с 2 vCPU каждый, чем если дать этим гостям по 3 vCPU. Вроде ресурсов нарезанно одинаково, но из за особенностей планировщика ресурсов, какие-то такты процессора будут пропускаться и оба гостя будут тормозить сильнее в такой схеме