Ребята, вопрос про udf и pyspark. Так вышло, что использование собственных udf, написанных на python, приводит к довольно медленной работе джобы. Но ходят слухи, что можно реализовать функцию на Java/Scala, а потом её использовать в своём python-коде, и вроде как работать это будет быстрей. Может ли кто-нибудь посоветовать какой-нибудь туториал по этому поводу или репозиторий, где что-то подобное реализовано, или книгу какую-то. Желательно, чтобы это была связка python/Java.