Size: a a a

2021 January 07

ПФ

Паша Финкельштейн... in Moscow Spark
В общем я бы не бежал ставить 3.1.0 на прод
источник
2021 January 10

GP

Grigory Pomadchin in Moscow Spark
что за спам такой странный интересно
источник

GP

Grigory Pomadchin in Moscow Spark
они паблик может рекламят какойто
источник

Oleg אולג in Moscow Spark
познавательный
источник
2021 January 13

ВК

Вячеслав Колосков... in Moscow Spark
Добрый день.
Подскажите, запускаю модель lgbm на спарке (mmlspark). Два раза обучаю модель на одних и тех же данных и два раза делаю предсказание. Получаю два разных результата. Они отличаются не сильно, но отличаются. В чем может быть проблема?
источник

AS

Andrey Smirnov in Moscow Spark
Вячеслав Колосков
Добрый день.
Подскажите, запускаю модель lgbm на спарке (mmlspark). Два раза обучаю модель на одних и тех же данных и два раза делаю предсказание. Получаю два разных результата. Они отличаются не сильно, но отличаются. В чем может быть проблема?
Slightly different result between runs

This could happen, due to non-determinism in floating point summation order and multi-threading. Though the general accuracy will usually remain the same.

плюс, вы random.seed выставляете одним и тем же?
источник

ВК

Вячеслав Колосков... in Moscow Spark
Andrey Smirnov
Slightly different result between runs

This could happen, due to non-determinism in floating point summation order and multi-threading. Though the general accuracy will usually remain the same.

плюс, вы random.seed выставляете одним и тем же?
а где random.seed устанавливается? в локальной версии lgbm есть параметр random_seed. а в спарк версии его нет (есть параметр baggingSeed но он не помогает).
источник

AS

Andrey Smirnov in Moscow Spark
Вячеслав Колосков
а где random.seed устанавливается? в локальной версии lgbm есть параметр random_seed. а в спарк версии его нет (есть параметр baggingSeed но он не помогает).
видимо его нет, кроме того даже локально никто не гарантирует что результаты буду повторяться, а тут я думаю после этого уже можно дальше не смотреть
https://github.com/Azure/mmlspark/blob/master/src/main/scala/com/microsoft/ml/spark/lightgbm/LightGBMBase.scala#L31
источник

A

Anton Lebedevich in Moscow Spark
Andrey Smirnov
видимо его нет, кроме того даже локально никто не гарантирует что результаты буду повторяться, а тут я думаю после этого уже можно дальше не смотреть
https://github.com/Azure/mmlspark/blob/master/src/main/scala/com/microsoft/ml/spark/lightgbm/LightGBMBase.scala#L31
в самом lightgbm локально в однопоточном режиме при зафиксированных сидах все отлично повторяется
источник

AS

Andrey Smirnov in Moscow Spark
А в многопоточном?
источник
2021 January 15

ВК

Вячеслав Колосков... in Moscow Spark
а кто знает хороший курс по спарку на русском?
источник

С

Сюткин in Moscow Spark
Вячеслав Колосков
а кто знает хороший курс по спарку на русском?
Попробуй newprolab
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Не то чтобы есть варианты кроме него )
источник

ВК

Вячеслав Колосков... in Moscow Spark
а курс от bigdataschool никто не проходил? посмотрел видео их на ютубе вроде норм...
источник

e

er@essbase.ru in Moscow Spark
Сюткин
Попробуй newprolab
Курс прекрасный ) когда есть рядом  сеньер который поможет его пройти.  😂    но да , задаёт планку и мотивирует изучать )
источник

AK

Alena Korogodova in Moscow Spark
Сюткин, у тебя был синьор под боком?)
источник

РП

Роман Пашкевич... in Moscow Spark
а синьорита?
источник

AK

Alena Korogodova in Moscow Spark
Так вот как на 100% курсы проходят...
источник

С

Сюткин in Moscow Spark
Alena Korogodova
Сюткин, у тебя был синьор под боком?)
Хм... было желание пройти испытательный срок много лет назад

Синьорит я тогда не знал
источник

PK

Pavel Klemenkov in Moscow Spark
Паша Финкельштейн
Не то чтобы есть варианты кроме него )
источник