Size: a a a

2020 August 29

RI

Rudnev Il’ya in Moscow Spark
Pavel Klemenkov
Такой команды нет
А как давно нет?
источник

PK

Pavel Klemenkov in Moscow Spark
Nikita
Что странно, потому что она лежит в ${SPARK_HOME}/bin рядом с сабмитом и шеллом, проверил у себя на 2.3.1 и свежескаченной 2.4.6
Прошу прощения, просто никогда не сталкивался с ней. Думал, что это от шарка осталось в древних версиях.
источник

PK

Pavel Klemenkov in Moscow Spark
exec "${SPARK_HOME}"/bin/spark-submit --class org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver "$@"
источник

PK

Pavel Klemenkov in Moscow Spark
Забавно
источник

AA

Anton Alekseev in Moscow Spark
Ребят привет, подскажите. Хочется для одной части пайплайн сохранить воспроизводимость. А именно проводить одинаковую кластеризацию для каждого запуска на кластере, естественно фиксация сида для pyspark.ml.clustering.KMeans не помогла, репартишн перед кластеризацией, тоже не спасает ситуацию. Как-то можно законно это сделать? Хочется хотя бы для одного и того же кластера обеспечить стабильность.
источник

BG

Bogdan Gromov in Moscow Spark
Anton Alekseev
Ребят привет, подскажите. Хочется для одной части пайплайн сохранить воспроизводимость. А именно проводить одинаковую кластеризацию для каждого запуска на кластере, естественно фиксация сида для pyspark.ml.clustering.KMeans не помогла, репартишн перед кластеризацией, тоже не спасает ситуацию. Как-то можно законно это сделать? Хочется хотя бы для одного и того же кластера обеспечить стабильность.
С initSteps игрался?
источник

AA

Anton Alekseev in Moscow Spark
Bogdan Gromov
С initSteps игрался?
нет, щас попробую, спасибо за идею.
источник

AA

Anton Alekseev in Moscow Spark
хотя судя по доке он по дефолту 2
источник

AA

Anton Alekseev in Moscow Spark
то есть не должен аффектить
источник

BG

Bogdan Gromov in Moscow Spark
Поставь 20
источник

AA

Anton Alekseev in Moscow Spark
Bogdan Gromov
Поставь 20
Магическое число, как 42 для DS?:) Окей, тестирую.
источник

AT

Andrey Tsibulskiy in Moscow Spark
Повелитель Бури
Привет! Скажите пожалуйста а  вызывать spark submit с query нельзя? Надо обязательно  писать jar?
Можно сделать  spark- shell -i filename.scala там сразу без инициализации контекста/ сессии пишешь бизнес логику
источник

ПБ

Повелитель Бури... in Moscow Spark
Andrey Tsibulskiy
Можно сделать  spark- shell -i filename.scala там сразу без инициализации контекста/ сессии пишешь бизнес логику
Спасибо! Попробую 👍
источник
2020 August 30

ПФ

Паша Финкельштейн... in Moscow Spark
@pklemenkov ты работу не искал? Или может @pomadchin
источник

PK

Pavel Klemenkov in Moscow Spark
Паша Финкельштейн
@pklemenkov ты работу не искал? Или может @pomadchin
Че там, спаммеры в теслу предлагают? ))
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Pavel Klemenkov
Че там, спаммеры в теслу предлагают? ))
Не, в этот раз подработка по пять или даже десять баксов!
источник

PK

Pavel Klemenkov in Moscow Spark
Паша Финкельштейн
Не, в этот раз подработка по пять или даже десять баксов!
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А ты же можешь посмотреть историю удаления сообщений ))
источник

PK

Pavel Klemenkov in Moscow Spark
Паша Финкельштейн
А ты же можешь посмотреть историю удаления сообщений ))
Да? Круто! Пойду погляжу, а то вдруг Гриша всю классную работу себе забрал )
источник
2020 August 31

GP

Grigory Pomadchin in Moscow Spark
за рулем был, но ничего себе
источник