Size: a a a

2021 April 29

ДМ

Даниил Московский... in Moscow Spark
Ага. Мы делаем permutation test, просто значения шаффлим внутри колонки и смотрим скор. Бывает он вырастает))
источник

ДМ

Даниил Московский... in Moscow Spark
Да походу тут материала на пару выступлений хватит, так что поделимся
источник

R

Renarde in Moscow Spark
самое веселое обычно начинается уже после обучения таких моделей на 10^4 фичей
например SLA на инференс <2 секунд и 10^4 фичей сложно совмещаются
источник

R

Renarde in Moscow Spark
ну и совсем класс - это распределенное дообучение на стримах с SLA на инференс <2 секунд - вот тут я вообще не видел готовых решений
источник

ДМ

Даниил Московский... in Moscow Spark
У нас пока не все так строго. Хотя я тоже без понятия, как такое решать. Хотя железками наверно можно закидать, главное табличку нормально на куски резать и успевать раскидывать по воркерам)
источник

PK

Pavel Klemenkov in Moscow Spark
Нет, они столько стоят из-за других людей.
источник

PK

Pavel Klemenkov in Moscow Spark
Зарплата нет. Но ведь я ещё и акционер ;)
источник

AS

Andrey Smirnov in Moscow Spark
камон, карточки столько стоят из-за криптоманов эфирных, а не за этих матриц
источник
2021 April 30

ПБ

Повелитель Бури... in Moscow Spark
Доброй ночи! Скажите пожалуйста, а спарк вообще прожорливый на ресурсы? Работаю с табличкой в сотни тысяч строк, отъел всю память и отработал за минуту.

Может не так готовлю?)
источник

GP

Grigory Pomadchin in Moscow Spark
съест все что можно
источник

GP

Grigory Pomadchin in Moscow Spark
дай меньше съест меньше
источник

ПБ

Повелитель Бури... in Moscow Spark
Тогда подает с out of memory
Может где калькулятр есть, объем данных к core mem?
источник

GP

Grigory Pomadchin in Moscow Spark
калькулятор гдето есть
источник

GP

Grigory Pomadchin in Moscow Spark
у яцека чет было
источник

GP

Grigory Pomadchin in Moscow Spark
но оно не точно, дело в том что у всех разные данные
источник

GP

Grigory Pomadchin in Moscow Spark
рекомендую те сделать ехекуторы тонкими по ядру и малым колвом оперативы и постепенно увлеичивать чтоб понять в чем дело
источник

GP

Grigory Pomadchin in Moscow Spark
когда у ехекуторов много ядер тяжело рассчитать скок памяти они будут подтреблять, т.к. не ясно тчоно скок конкретно тасок и какая из их убивает
источник

GP

Grigory Pomadchin in Moscow Spark
(ну понятно что на момент падения плохо все я к тому что не так очиедвно как рассчитать параметры)
источник

ПБ

Повелитель Бури... in Moscow Spark
Может ярн копать? А то кластер зеленый, а джобы сыпятся как яблоки
источник

GP

Grigory Pomadchin in Moscow Spark
зачем копать ярн, не понял
источник