Телеграмм чат группы moscowspark страница 372

Всем привет!
Может кто-нибудь в двух ссылках помочь, рассказаать как правильно
mmlspark поставить на кластер?
чтобы под python api работало

Друг интересуется

источник

17:05пожаловаться #12

2020 June 03

ПФ

Паша Финкельштейн... in Moscow Spark

No Name

Проблема в том, что я несколько раз на нее натыкался в разных местах, когда пытался разобраться в мемори менеджменте. И в одной презе датабрикса я слышал упоминание вот этой юзер мемори. И это путает, безусловно.

кажется надо просто почитать про хип/оффхип и не забивать себе голову

источник

00:27пожаловаться #13

ПФ

Паша Финкельштейн... in Moscow Spark

Pavel Klemenkov

Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была

ну потому что 10 гигов сложно крутить на локальной машине уже

источник

00:31пожаловаться #14

Pavel Klemenkov in Moscow Spark

Паша Финкельштейн

ну потому что 10 гигов сложно крутить на локальной машине уже

Да лан, кого сейчас удивишь тачками с терабайтом оперативы?

источник

00:32пожаловаться #15

ПФ

Паша Финкельштейн... in Moscow Spark

Pavel Klemenkov

Да лан, кого сейчас удивишь тачками с терабайтом оперативы?

так все ж на макбуках работают, а там вот ток-ток 32 научились )

источник

00:32пожаловаться #16

Pavel Klemenkov in Moscow Spark

Паша Финкельштейн

так все ж на макбуках работают, а там вот ток-ток 32 научились )

На макбуке и Спарк так себе работает )

источник

00:36пожаловаться #17

ПФ

Паша Финкельштейн... in Moscow Spark

Pavel Klemenkov

На макбуке и Спарк так себе работает )

Но на 10 гигов должно быть норм :) Даже может быть с local[2]

источник

00:36пожаловаться #18

lvm in Moscow Spark

Ivan Kolemasov

Я ставил jar по инструкции

источник

02:09пожаловаться #19

Timur Zalimov in Moscow Spark

Через spark забираю данные из oracle, в исходной таблички есть тип number который через jdbc парситься в decimal ... мне необходимо этот number промапить в int или double
Пытался это сделать через автогенерацию schema для df с использованием методанных от all_column_tabs, но не смог найти как различить number по его реальному типу ... мб кто сталкивался и знает как быть ?

источник

11:49пожаловаться #20