вот допустим, сложение можно организовать последовательно, с переносом флага в следующий бит, тогда 32-битные инты сложатся за 32 такта. это медленно, но оч просто.
а есть параллельная схема сложения, называется "с быстрым переносом", там переносы вычисляет отдельная схема, в итоге всё сложение можно реально сделать за один такт