Ну, дело не столько в си, а в arrow. По факту не происходит копирования данных из jvm в питоновский процесс, память просто мапится через arrow. А основной оверхед в udf, все же, на сериализацию-десериализацию
Я имел в виду, что не только джаватупитон не происходит, но и сами математические операции производятся на си, что должно приводить к ускорению - отсутствие мэнэджед памяти, всякие там avx-оптимизиции