Size: a a a

2018 February 26

GP

Grigory Pomadchin in Moscow Spark
и поэтому я предложил запустить шелл на машине с которой ты паблишишь, такой же простой ярн шелл который конкектится к мастеру твоего кластера, что бы исключить мискфониг кластера / енв варайблов
источник

GP

Grigory Pomadchin in Moscow Spark
шелл фактически будет примитивнейший тест спарк сабмита, без 3д пати зависимостей
источник

KM

Kirill Malev in Moscow Spark
запускаю построчно в шелле все
источник

KM

Kirill Malev in Moscow Spark
посмотрим
источник

KM

Kirill Malev in Moscow Spark
scala> val as_df = not_as_df.map( v => v.split(";")).map( v => my_class_case_defined_outside_main(v(0), v(1).toLong, v(2).toLong, v(3).toLong, v.lift(4).getOrElse(null))).toDF
as_df: org.apache.spark.sql.DataFrame = [field_type: string, uid: bigint ... 3 more fields]


scala> as_df()
res4: Array[org.apache.spark.sql.Row] = Array([field_type,916480005,3475350150,3614970576,….
источник

KM

Kirill Malev in Moscow Spark
коллект тоже через шелл вызывается тут
источник

KM

Kirill Malev in Moscow Spark
у меня вот так вот импортируются implicits:

object MyApp {
       val conf = new SparkConf()
                       .setIfMissing("spark.app.name", "MyApp")
                     .setIfMissing("spark.master", "yarn-client")

       val sc = new SparkContext(conf)
       val sqlContext = new org.apache.spark.sql.SQLContext(sc)

       import sqlContext._
       import sqlContext.implicits._

 case class my_class_case_defined_outside_main (field_type: String, uid: Long, souid: Long, suid: Long, duration: String)

 def main(args: Array[String]) {
источник

GP

Grigory Pomadchin in Moscow Spark
а как запускал шелл?
источник

KM

Kirill Malev in Moscow Spark
/bin/spark-shell --master yarn --deploy-mode client
источник

GP

Grigory Pomadchin in Moscow Spark
ясно, косячок)
источник

KM

Kirill Malev in Moscow Spark
?
источник

KM

Kirill Malev in Moscow Spark
в чем?
источник

GP

Grigory Pomadchin in Moscow Spark
ну видимо в сборке джарика, ты пробовал деплоить что-нибудь еще?
источник

GP

Grigory Pomadchin in Moscow Spark
попробуй почисть билд сбт

https://pastebin.com/CGWtT2hG

и провайдед скоуп я убрал, что бы если что видеть все косяки либ
источник

KM

Kirill Malev in Moscow Spark
Grigory Pomadchin
ну видимо в сборке джарика, ты пробовал деплоить что-нибудь еще?
неа)
источник

GP

Grigory Pomadchin in Moscow Spark
попробуй мин экзампл какойнить, типа проект, там ток спарк кор скала 2.11 и считает пай
источник

GP

Grigory Pomadchin in Moscow Spark
или хелоу ворлд принтит через путем коллекта после распаралеливания (раскидывания на ноды) последовталеьности символов
источник

KM

Kirill Malev in Moscow Spark
samplePi запускал
источник

KM

Kirill Malev in Moscow Spark
с этим билдом
источник

KM

Kirill Malev in Moscow Spark
источник