MB
Вы когда запускаете аппликейшн (spark-submit) с virtualenv на Sparke, используете:
1.
--archives environment.tar.gz#environment
и PYSPARK_DRIVER_PYTHON, PYSPARK_PYTHON? (то есть отправляете environment по нодам)
2. или у вас уже разархивирован _virtualenv_ на нодах (через ансибл например), и просто прописываете путь:
spark.pyspark.virtualenv.bin.path
, spark.yarn.appMasterEnv.PYSPARK_PYTHON
и тд?(то есть заранее установлен, только запускаете)
-
вроде как вариант с отправкой tar выглядит красиво?
но я вообще ни разу так не делал...