Size: a a a

2020 June 02

T

T in Moscow Spark
Pavel Klemenkov
Спарк в спот инстансах? Это только для сильных!
все зависит от задачи
источник

ЕГ

Евгений Глотов... in Moscow Spark
Думаю, какие возможности есть, такие и используют, не у всех есть вообще кластеры
источник

PK

Pavel Klemenkov in Moscow Spark
No Name
Ну все, ща в сайнтисты пойду, ядро шатать.
Не-не, все места заняты )
источник

T

T in Moscow Spark
в комбинации с инстасфлиит на коротких задача до 4х часов все норм живет
источник

NN

No Name in Moscow Spark
Pavel Klemenkov
Не-не, все места заняты )
Да что ж такое
источник

PN

Pritykovskaya Natash... in Moscow Spark
Pavel Klemenkov
Не-не, все места заняты )
источник

AS

Andrey Smirnov in Moscow Spark
Pavel Klemenkov
Нахер этот Спарк, спрашивается? )
подожди, а Хуанг тут для кого тут рассказывал как gpu в спарке будет бороздить мировые океаны? дал бог кластер, даст и задачу
источник

N

Nikolay in Moscow Spark
Евгений Глотов
Разработчики спарка такие "а давайте 30% утечки памяти запишем в юзер мемори"😆👌
С чего такой вывод?
источник

PK

Pavel Klemenkov in Moscow Spark
Andrey Smirnov
подожди, а Хуанг тут для кого тут рассказывал как gpu в спарке будет бороздить мировые океаны? дал бог кластер, даст и задачу
Не, ну это ж другое совсем )
источник

PK

Pavel Klemenkov in Moscow Spark
Nikolay
С чего такой вывод?
Из бритвы Хэнлона скорее всего)
источник

ЕГ

Евгений Глотов... in Moscow Spark
Nikolay
С чего такой вывод?
Да это шутка была)
источник

IK

Ivan Kolemasov in Moscow Spark
Всем привет!
Может кто-нибудь в двух ссылках помочь, рассказаать как правильно
mmlspark поставить на кластер?
чтобы под python api работало

Друг интересуется
источник
2020 June 03

ПФ

Паша Финкельштейн... in Moscow Spark
No Name
Проблема в том, что я несколько раз на нее натыкался в разных местах, когда пытался разобраться в мемори менеджменте. И в одной презе датабрикса я слышал упоминание вот этой юзер мемори. И это путает, безусловно.
кажется надо просто почитать про хип/оффхип и не забивать себе голову
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Pavel Klemenkov
Ваще канеш ржака была, когда в кейноуте на Спарк саммите создатель scikit-learn показал результаты опросов дата сатанистов, типа с каким размером датасетов вы работаете. И там уверенная такая медиана где в 10гб была
ну потому что 10 гигов сложно крутить на локальной машине уже
источник

PK

Pavel Klemenkov in Moscow Spark
Паша Финкельштейн
ну потому что 10 гигов сложно крутить на локальной машине уже
Да лан, кого сейчас удивишь тачками с терабайтом оперативы?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Pavel Klemenkov
Да лан, кого сейчас удивишь тачками с терабайтом оперативы?
так все ж на макбуках работают, а там вот ток-ток 32 научились )
источник

PK

Pavel Klemenkov in Moscow Spark
Паша Финкельштейн
так все ж на макбуках работают, а там вот ток-ток 32 научились )
На макбуке и Спарк так себе работает )
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Pavel Klemenkov
На макбуке и Спарк так себе работает )
Но на 10 гигов должно быть норм :) Даже может быть с local[2]
источник

l

lvm in Moscow Spark
Ivan Kolemasov
Всем привет!
Может кто-нибудь в двух ссылках помочь, рассказаать как правильно
mmlspark поставить на кластер?
чтобы под python api работало

Друг интересуется
Я ставил jar по инструкции
источник

TZ

Timur Zalimov in Moscow Spark
Через spark забираю данные из oracle, в исходной таблички есть тип number который через jdbc парситься в decimal ... мне необходимо этот number промапить в int или double
Пытался это сделать через автогенерацию schema для df с использованием методанных от all_column_tabs, но не смог найти как различить number по его реальному типу ... мб кто сталкивался и знает как быть ?
источник