Всем привет! Подскажите, пожалуйста, как обойти такой момент, на кластере стоит python2.7, а на нашем сервере 3.7, и когда мы пытаем использовать udf, получаем ошибку "Python in worker has differentversion 2.7 than that in driver 3.7. PySpark cannot run with defferent minor versions."
Есть ли способ как-то работать, не устанавливая на всех узлах версию 3.7
Если нет прав установить питон по-нормальному, есть относительно лёгкий варик обхода - пишем UDF, в котором закидываем папку с питоном из хдфс например на ноду, где работает спарк воркер, в папку /tmp/py37, а дальше перезапускаем спарк с этим путём к питону