ну и там, соответственно, чем больше вычислений проводишь (одна итерация - 1 умножение и 1 вычитание afaik), тем точнее подходишь к решению, но если точность - 8 бит, то, заданной точности достаточно быстро можно достигнуть
Новое предложение которое объединяющее FMA, Approximate reciprocal/reciprocal sqrt и прочие не всеми процессорами поддерживаемые иеструкции и собственно способ определия этой поддержки: https://github.com/WebAssembly/relaxed-simd