Size: a a a

2019 January 14

N

Nikolay in Moscow Spark
Посмотрел ещё вот в исходниках. Он там делает aggregate на всех полях . И схлопывается типы
источник

N

Nikolay in Moscow Spark
Типа если нашел что-то и Стрингер, то будет Стринг. Если у двух строк типы одинаковы, то будет этот тип. Если nullType, то тип остаётся. Т.е он все читает. И для каждой колонки у всех строк определяет тип
источник
2019 January 18

N

Nikolay in Moscow Spark
А что делает parallelize внутри
источник

N

Nikolay in Moscow Spark
Вот я ему передал коллекцию.он же ленивый . Просто ее сохранит где -то во внутреннем поле. А потом
источник

PK

Pavel Klemenkov in Moscow Spark
Он тупо создает инстанс класса ParallelCollectionRDD. А он нарезает коллекцию на куски https://github.com/apache/spark/blob/e3418649dcb50f2a2fb977560d87a94c81516198/core/src/main/scala/org/apache/spark/rdd/ParallelCollectionRDD.scala#L110
источник
2019 January 23

ML

Mark Lebedev in Moscow Spark
Всем привет!
Подскажите, кто сдавал сертификацию CCA175 в ближайшее время, там были задания на flume? Если были, то в каком формате?
источник

AP

Alexander Piminov in Moscow Spark
В 2017 году не было🙂 Были HDFS, SQOOP и Spark.
источник

S

Stanislav in Moscow Spark
Интересно, есть ли вообще толк от сертов. Особенно после объединения
источник

r

rubonz in Moscow Spark
В штатах любят эти сертифиты, во всяком случае HR на них обращают внимания.
Объединение на CCA/ССP никак не скажется.
источник

AP

Alexander Piminov in Moscow Spark
+ зависит от индустрии, в консалтинге наличие сертификатов помогает поддержанию партнерских статусов и позициям в тендерах, что является плюсом для кандидата при приеме.
источник

PK

Pavel Klemenkov in Moscow Spark
В штатах вообще любят ярлыки. Например нанимать phd, что в 80% случаев просто шлак
источник
2019 January 25

S

Stanislav in Moscow Spark
Тогда уточнение, что котируеься больше, цц или хдп серты? Или однофигственно?
источник

FL

Fedor Lavrentyev in Moscow Spark
Разница несущественна, но цц немного круче
источник

FL

Fedor Lavrentyev in Moscow Spark
У цц была серия совсем элитных серитификатов, но потом ее перестали давать
источник

S

Stanislav in Moscow Spark
Спс
источник

N

Nikolay in Moscow Spark
Что за цц?
источник

FL

Fedor Lavrentyev in Moscow Spark
Цлоудера Цертифиед. Иф ай спик фром май харт ин инглиш.
источник

N

Nikolay in Moscow Spark
Спасибо )
источник
2019 January 30

ДК

Дмитрий Курганский... in Moscow Spark
Может кто дать совет как скинуть csv с hdfs на удаленном  кластере в сетевую директорию доступную мне с локального компа? Я пока знаю как кидать с hdfs на ftp (lftp) или в локальный путь кластера... Хочется самый простой способ, потому что мало прав на кластере... Буду рад любым советам даже пойти... чего почитать)
источник

ЕГ

Евгений Глотов... in Moscow Spark
а сетевая папка на чём крутится? виндовая небось?
источник