Это просто значит, что они конкретно в этом тесте чего-то под тест подкрутили. Или просто конкретный интринсик в конкретном тесте лучше работает. Там еще на разных версия JVM разница огромная. По некоторым нашим тестам GraalVM выигрывает у openj9 раз в 6. Повторюсь, микробенчмарки - это очень мутная вещь, по ним ни о чем судить нельзя. Есть ряд вещей, которые действительно надо вылизывать до умопомрачения - какие-нибудь bulk operations на блоках и тензорах. То, что заведомо бедут ботлнеком. Но тут опять есть нюансы. Индивидуальный пиковый перформанс таких операций, скажем в numpy очень высок, но чтобы добиться этого пика, надо писать очень-очень специфичный код и месяц сидеть с профайлером (который в питоне очень так себе).