Ну тогда надо gpgpu пилить
Ну условное "gpgpu" nvidia и лезет. Ну это специфичная область, нужно понимать что видюха выполняет за условный такт сразу на 64 АЛУ(к примеру), Но инструкции он может только одну выполнять, потому instruction cache(вроде так называет), область куда загружается команда одна на 64 алу сразу. Это полезно когда складываешь например большие массивы, можешь сразу за такт 64 числа сложить. НО прикол в том что в реальности, задачи который выполняет пека, они не требует SIMD. Например открытьи файла на диске в любом случае займет один блок а остальные 63 блока будут молотиться в пустую. На этом кстати VLIW и оборалась как архитектура, для нее в свое время просто не софта не задач не нашли.