Size: a a a

2018 May 24

PK

Pavel Klemenkov in Moscow Spark
источник

PJ

Paul Jones in Moscow Spark
Не пробовал, но звучит круто)
источник

PJ

Paul Jones in Moscow Spark
И кстати, чем не тема для доклада на Митапе по Spark + DL?
источник

PK

Pavel Klemenkov in Moscow Spark
Paul Jones
И кстати, чем не тема для доклада на Митапе по Spark + DL?
Ну так я поэтому и закинул удочку ;)
источник

PJ

Paul Jones in Moscow Spark
😊👍
источник

NU

Nikita U in Moscow Spark
Я запускал всякие примеры (работает), реальных задач не решал
источник

PK

Pavel Klemenkov in Moscow Spark
Nikita U
Я запускал всякие примеры (работает), реальных задач не решал
👍
источник
2018 May 28

R

Rogoley in Moscow Spark
Pavel Klemenkov
Всем привет, тухловато было в чатике последнее время, пришло время его взбодрить. Мы с коллегами из Яндекса, Одноклассников и Физтеха запустили специализацию на курсере https://www.coursera.org/specializations/big-data-engineering
4-ый курс когда запустится? из альфы с начала года не выходит.
источник
2018 May 29

AV

Artyom Vybornov in Moscow Spark
На правах соавтора, отвечу.

Команда, выпускающая специализацию, сейчас практически все силы тратит на улучшение тестирующей системы. Пока мы не убедимся, что для слушателей эта система кардинально изменилась, выпускать 4й и 5й курсы в production не можем.
Работа над 4м курсом идет. Планируем отправить в релиз в течение ближайших месяцев.
источник

PK

Pavel Krylov in Moscow Spark
Artyom Vybornov
На правах соавтора, отвечу.

Команда, выпускающая специализацию, сейчас практически все силы тратит на улучшение тестирующей системы. Пока мы не убедимся, что для слушателей эта система кардинально изменилась, выпускать 4й и 5й курсы в production не можем.
Работа над 4м курсом идет. Планируем отправить в релиз в течение ближайших месяцев.
О каких курсах речь можно уточнить?
источник

AV

Artyom Vybornov in Moscow Spark
источник

R

Rogoley in Moscow Spark
Artyom Vybornov
На правах соавтора, отвечу.

Команда, выпускающая специализацию, сейчас практически все силы тратит на улучшение тестирующей системы. Пока мы не убедимся, что для слушателей эта система кардинально изменилась, выпускать 4й и 5й курсы в production не можем.
Работа над 4м курсом идет. Планируем отправить в релиз в течение ближайших месяцев.
спасибо за ответ. на почту мне с марта перестали отвечать о сроках. должгы были бету отправить на тест в марте еще.
источник
2018 May 30

SK

Sergey Karpov in Moscow Spark
Всем привет. После обновления до HDP 2.6.5 почему-то не запускается драйвер на всех нодах, кроме одной. говорит
 File "/test/script.py", line 3, in <module>
   sc = SparkContext()
 File "/usr/hdp/current/spark2-client/python/lib/pyspark.zip/pyspark/context.py", line 119, in __init__
 File "/usr/hdp/current/spark2-client/python/lib/pyspark.zip/pyspark/context.py", line 181, in _do_init
 File "/usr/hdp/current/spark2-client/python/lib/pyspark.zip/pyspark/context.py", line 279, in _initialize_context
 File "/usr/hdp/current/spark2-client/python/lib/py4j-0.10.6-src.zip/py4j/java_gateway.py", line 1428, in __call__
 File "/usr/hdp/current/spark2-client/python/lib/py4j-0.10.6-src.zip/py4j/protocol.py", line 320, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext.
: java.lang.NoSuchMethodError: org.apache.hadoop.yarn.proto.YarnProtos$ResourceProtoOrBuilder.getMemory()
....

не подскажете в какую сторону копать?
источник

ZM

ZLoyer Matveev in Moscow Spark
java.lang.NoSuchMethodError - конфликт версий или подсунута не та версия либы
источник
2018 June 19

K

KrivdaTheTriewe in Moscow Spark
источник

K

KrivdaTheTriewe in Moscow Spark
Книжка вышла на русском
источник

K

KrivdaTheTriewe in Moscow Spark
На всякий случай , купон - Spark
источник
2018 June 20

OI

Oleg Ivchenko in Moscow Spark
Спасибо, купил.
источник
2018 July 02

NK

ID:282687363 in Moscow Spark
А не подскажете истории успеха Spark без HDFS/Hive/S3 в качестве источника данных (то есть не когда Spark Streaming пишет куда-то не в Hadoop)? Я что-то навскидку не могу нагуглить.
источник

AV

Artyom Vybornov in Moscow Spark
А можешь уточнить вопрос?
Spark применим, когда нужны вычисления над большим объемом данных, эти данные надо где-то хранить. Поэтому внизу есть слой распределенного хранилища, аля HDFS или S3,
источник