Телеграмм чат группы moscowspark страница 36

Всем привет, тухловато было в чатике последнее время, пришло время его взбодрить. Мы с коллегами из Яндекса, Одноклассников и Физтеха запустили специализацию на курсере https://www.coursera.org/specializations/big-data-engineering

Coursera

Coursera | Online Courses From Top Universities. Join for Free

3,000+ courses from schools like Stanford and Yale - no application required. Build career skills in data science, computer science, business, and more.

4-ый курс когда запустится? из альфы с начала года не выходит.

источник

19:39пожаловаться #8

2018 May 29

AV

Artyom Vybornov in Moscow Spark

На правах соавтора, отвечу.

Команда, выпускающая специализацию, сейчас практически все силы тратит на улучшение тестирующей системы. Пока мы не убедимся, что для слушателей эта система кардинально изменилась, выпускать 4й и 5й курсы в production не можем.
Работа над 4м курсом идет. Планируем отправить в релиз в течение ближайших месяцев.

источник

00:14пожаловаться #9

PK

Pavel Krylov in Moscow Spark

Artyom Vybornov

На правах соавтора, отвечу.

Команда, выпускающая специализацию, сейчас практически все силы тратит на улучшение тестирующей системы. Пока мы не убедимся, что для слушателей эта система кардинально изменилась, выпускать 4й и 5й курсы в production не можем.
Работа над 4м курсом идет. Планируем отправить в релиз в течение ближайших месяцев.

О каких курсах речь можно уточнить?

источник

09:32пожаловаться #10

AV

Artyom Vybornov in Moscow Spark

https://www.coursera.org/specializations/big-data-engineering

Coursera

Coursera | Online Courses From Top Universities. Join for Free

3,000+ courses from schools like Stanford and Yale - no application required. Build career skills in data science, computer science, business, and more.

источник

09:36пожаловаться #11

R

Rogoley in Moscow Spark

Artyom Vybornov

На правах соавтора, отвечу.

Команда, выпускающая специализацию, сейчас практически все силы тратит на улучшение тестирующей системы. Пока мы не убедимся, что для слушателей эта система кардинально изменилась, выпускать 4й и 5й курсы в production не можем.
Работа над 4м курсом идет. Планируем отправить в релиз в течение ближайших месяцев.

спасибо за ответ. на почту мне с марта перестали отвечать о сроках. должгы были бету отправить на тест в марте еще.

источник

09:53пожаловаться #12

2018 May 30

SK

Sergey Karpov in Moscow Spark

Всем привет. После обновления до HDP 2.6.5 почему-то не запускается драйвер на всех нодах, кроме одной. говорит

 File "/test/script.py", line 3, in <module>
    sc = SparkContext()
  File "/usr/hdp/current/spark2-client/python/lib/pyspark.zip/pyspark/context.py", line 119, in __init__
  File "/usr/hdp/current/spark2-client/python/lib/pyspark.zip/pyspark/context.py", line 181, in _do_init
  File "/usr/hdp/current/spark2-client/python/lib/pyspark.zip/pyspark/context.py", line 279, in _initialize_context
  File "/usr/hdp/current/spark2-client/python/lib/py4j-0.10.6-src.zip/py4j/java_gateway.py", line 1428, in __call__
  File "/usr/hdp/current/spark2-client/python/lib/py4j-0.10.6-src.zip/py4j/protocol.py", line 320, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext.
: java.lang.NoSuchMethodError: org.apache.hadoop.yarn.proto.YarnProtos$ResourceProtoOrBuilder.getMemory()
....

не подскажете в какую сторону копать?

источник

14:13пожаловаться #13

ZM

ZLoyer Matveev in Moscow Spark

java.lang.NoSuchMethodError - конфликт версий или подсунута не та версия либы

источник

14:13пожаловаться #14

2018 June 19

K

KrivdaTheTriewe in Moscow Spark

https://www.piter.com/collection/bestsellery-oreilly/product/effektivnyy-spark-masshtabirovanie-i-optimizatsiya

Piter

Эффективный Spark. Масштабирование и оптимизация

Книга об эффективном использовании Фреймворка Spark с решениями на языках Java, Scala и Python

источник

13:55пожаловаться #15

K

KrivdaTheTriewe in Moscow Spark

Книжка вышла на русском

источник

13:55пожаловаться #16

K

KrivdaTheTriewe in Moscow Spark

На всякий случай , купон - Spark

источник

13:56пожаловаться #17

2018 June 20

OI

Oleg Ivchenko in Moscow Spark

Спасибо, купил.

источник

13:06пожаловаться #18

2018 July 02

NK

ID:282687363 in Moscow Spark

А не подскажете истории успеха Spark без HDFS/Hive/S3 в качестве источника данных (то есть не когда Spark Streaming пишет куда-то не в Hadoop)? Я что-то навскидку не могу нагуглить.

источник

09:55пожаловаться #19

AV

Artyom Vybornov in Moscow Spark

А можешь уточнить вопрос?
Spark применим, когда нужны вычисления над большим объемом данных, эти данные надо где-то хранить. Поэтому внизу есть слой распределенного хранилища, аля HDFS или S3,

источник

10:02пожаловаться #20