У меня вообще такое впечатление, что все что не покрывается кодогенерацией для JS а это numbers (64-bits) и int32 оптимизировано далеко не идеально. Такая же ситуация была замереза c i64.div и i64.rem которые намного медленее работают чем должны особенно когда делитель константа