Вообще, если касаться процессоров, то если просто выполнять команды по отдельности, то на каждую команду нужно как минимум несколько тактов (на чтение инструкции, выполнение, запись результата и т.д). Затем придумали конвейерную схему, то есть пока одна инструкция выполняется, другая считывается и т.д., то таким образом теоретически возможно добиться, что среднее время выполнения одной команды близко к 1 такту. Но возможно и добиться лучших результатов, здесь как раз появляется архитектура VLIW, если, например, одновременно в конвейерном режиме выполняются 4 команды, то среднее время выполнения одной команды может быть, например, 0.25 такта.