Телеграмм чат группы moscowspark страница 368

from pyspark.sql.functions import pandas_udf, PandasUDFType

@pandas_udf("id long, v double", PandasUDFType.GROUPED_MAP)
def subtract_mean(pdf):
    # pdf is a pandas.DataFrame
    v = pdf.v
    return pdf.assign(v=v - v.mean())

В итоге получилось вернуть модель в виде текста. Можно сделать через lgbm.Booster.model_to_string или через pickle.dumps()

источник

01:41пожаловаться #7

No Name in Moscow Spark

Дамы и господа, позвольте нубский вопрос по мемори менеджменту - как используется в экзекуторе юзер мемори?

источник

02:03пожаловаться #8

Grigory Pomadchin in Moscow Spark

No Name

Дамы и господа, позвольте нубский вопрос по мемори менеджменту - как используется в экзекуторе юзер мемори?

юзер мемори?

источник

02:39пожаловаться #9

No Name in Moscow Spark

Grigory Pomadchin

юзер мемори?

Ага. Неоднократно встречал упоминания о ней, но с минимальными пояснениями о том, для чего она.

источник

03:13пожаловаться #10

No Name in Moscow Spark

Grigory Pomadchin

юзер мемори?

источник

03:13пожаловаться #11

Grigory Pomadchin in Moscow Spark

источник

03:15пожаловаться #12

Grigory Pomadchin in Moscow Spark

тут имеется ввиду что это память которая тебе доступна для операций после того что спарк на свои нужды отожрет

источник

03:15пожаловаться #13

No Name in Moscow Spark

Grigory Pomadchin

Ну, погоди. Ты хочешь сказать, что они так обозвали часть памяти, которая мне не понадобилась?

источник

03:22пожаловаться #14

Grigory Pomadchin in Moscow Spark

No Name

Ну, погоди. Ты хочешь сказать, что они так обозвали часть памяти, которая мне не понадобилась?

ну над конкретно с автором картинки собжудать

источник

03:25пожаловаться #15

Grigory Pomadchin in Moscow Spark

вообще да мне кажется это память которую ты можешь использовать чтоб

источник

03:25пожаловаться #16

Grigory Pomadchin in Moscow Spark

не знаю агругаци написать какуюто и вот хешмапа будет жить в этой юзер мемори

источник

03:25пожаловаться #17

Grigory Pomadchin in Moscow Spark

но ты проверь с автором картинки что он имеет ввиду

источник

03:25пожаловаться #18

No Name in Moscow Spark

Grigory Pomadchin

не знаю агругаци написать какуюто и вот хешмапа будет жить в этой юзер мемори

Ну вот похоже, что так. Самое подробное описание из того, что я находил про нее :
"Lets say, you can store your own data structures in memory that would be used in RDD transformations or you want to write a user defined Spark Aggregation by using mapPartitions transformation maintaining hash table for this aggregation, all that will consume so called User Memory"

источник

03:28пожаловаться #19

Grigory Pomadchin in Moscow Spark

ну короч он чет свое значил

источник

03:36пожаловаться #20