От лайаута зависит только скорость - если выровнивание по 16 байт то будет быстрее только и всего, на некоторых архитектурах кстати просадка не значитлеьна.
Продвинутым компиляторам все равно на самом деле. Одноверные массивы разворачиваются потом векторизируются, n-мерные массивы - тайлятся потом векторизируются. В большинстве случаях это возможно
Похоже #WebAssembly пропозал Reference Types (phase 3), который является основой для многих других (в том числе Interface Types, Typed Function References, Exception Handling, Garbage Collector), скоро перейдет на phase 4.