вы упускаете тот момент, что в gpu, как и в самом сервере, есть разные компоненты: энкодер, декодер, память, ядра и т.д. Ваша офисная вм будет потреблять видео-память (скажем, 1гб), но и так же декодер/энкодер для передачи видео-потока. И вот этот декодер он ОДИН в gpu. Т.е. большая вероятность, что 8 виртуалок на T4 будут работать лучше, чем 24 виртуалки на RTX/A40 (декодер там похожий)