Телеграмм чат группы moscowspark страница 431

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2020 August 29

RI

Rudnev Il’ya in Moscow Spark

Pavel Klemenkov

Такой команды нет

А как давно нет?

источник

10:58пожаловаться #1

PK

Pavel Klemenkov in Moscow Spark

Что странно, потому что она лежит в ${SPARK_HOME}/bin рядом с сабмитом и шеллом, проверил у себя на 2.3.1 и свежескаченной 2.4.6

Прошу прощения, просто никогда не сталкивался с ней. Думал, что это от шарка осталось в древних версиях.

источник

11:09пожаловаться #2

PK

Pavel Klemenkov in Moscow Spark

exec "${SPARK_HOME}"/bin/spark-submit --class org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver "$@"

источник

11:13пожаловаться #3

PK

Pavel Klemenkov in Moscow Spark

Забавно

источник

11:13пожаловаться #4

AA

Anton Alekseev in Moscow Spark

Ребят привет, подскажите. Хочется для одной части пайплайн сохранить воспроизводимость. А именно проводить одинаковую кластеризацию для каждого запуска на кластере, естественно фиксация сида для pyspark.ml.clustering.KMeans не помогла, репартишн перед кластеризацией, тоже не спасает ситуацию. Как-то можно законно это сделать? Хочется хотя бы для одного и того же кластера обеспечить стабильность.

источник

12:01пожаловаться #5

BG

Bogdan Gromov in Moscow Spark

Anton Alekseev

Ребят привет, подскажите. Хочется для одной части пайплайн сохранить воспроизводимость. А именно проводить одинаковую кластеризацию для каждого запуска на кластере, естественно фиксация сида для pyspark.ml.clustering.KMeans не помогла, репартишн перед кластеризацией, тоже не спасает ситуацию. Как-то можно законно это сделать? Хочется хотя бы для одного и того же кластера обеспечить стабильность.

С initSteps игрался?

источник

12:06пожаловаться #6

AA

Anton Alekseev in Moscow Spark

С initSteps игрался?

нет, щас попробую, спасибо за идею.

источник

12:07пожаловаться #7

AA

Anton Alekseev in Moscow Spark

хотя судя по доке он по дефолту 2

источник

12:08пожаловаться #8

AA

Anton Alekseev in Moscow Spark

то есть не должен аффектить

источник

12:08пожаловаться #9

BG

Bogdan Gromov in Moscow Spark

Поставь 20

источник

12:08пожаловаться #10

AA

Anton Alekseev in Moscow Spark

Поставь 20

Магическое число, как 42 для DS?:) Окей, тестирую.

источник

12:11пожаловаться #11

AT

Andrey Tsibulskiy in Moscow Spark

Повелитель Бури

Привет! Скажите пожалуйста а вызывать spark submit с query нельзя? Надо обязательно писать jar?

Можно сделать spark- shell -i filename.scala там сразу без инициализации контекста/ сессии пишешь бизнес логику

источник

12:48пожаловаться #12

ПБ

Повелитель Бури... in Moscow Spark

Andrey Tsibulskiy

Можно сделать spark- shell -i filename.scala там сразу без инициализации контекста/ сессии пишешь бизнес логику

Спасибо! Попробую 👍

источник

22:51пожаловаться #13

2020 August 30

ПФ

Паша Финкельштейн... in Moscow Spark

@pklemenkov ты работу не искал? Или может @pomadchin

источник

21:15пожаловаться #14

PK

Pavel Klemenkov in Moscow Spark

Паша Финкельштейн

@pklemenkov ты работу не искал? Или может @pomadchin

Че там, спаммеры в теслу предлагают? ))

источник

21:29пожаловаться #15

ПФ

Паша Финкельштейн... in Moscow Spark

Pavel Klemenkov

Че там, спаммеры в теслу предлагают? ))

Не, в этот раз подработка по пять или даже десять баксов!

источник

21:29пожаловаться #16

PK

Pavel Klemenkov in Moscow Spark

Паша Финкельштейн

Не, в этот раз подработка по пять или даже десять баксов!

источник

21:30пожаловаться #17

ПФ

Паша Финкельштейн... in Moscow Spark

А ты же можешь посмотреть историю удаления сообщений ))

источник

21:31пожаловаться #18

PK

Pavel Klemenkov in Moscow Spark

Паша Финкельштейн

А ты же можешь посмотреть историю удаления сообщений ))

Да? Круто! Пойду погляжу, а то вдруг Гриша всю классную работу себе забрал )

источник

21:33пожаловаться #19

2020 August 31

GP

Grigory Pomadchin in Moscow Spark

за рулем был, но ничего себе

источник

00:01пожаловаться #20