Телеграмм чат группы moscowspark страница 332

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

2020 May 12

M

Mi in Moscow Spark

учитвая что это временные файлы, то сильной проблемы я не вижу, также учитвая что у S3 грустно с move операцией которую спарк активно использует, то может быть даже быстрее

источник

16:49пожаловаться #1

M

Mi in Moscow Spark

мне казалось что distcp тоже создает временные файлы

точно создает, учитывая что это набор MR задач

источник

16:49пожаловаться #2

JF

Jane Frankenstein in Moscow Spark

@meosit, спасибо

источник

16:55пожаловаться #3

M

Mi in Moscow Spark

да не за что

источник

16:57пожаловаться #4

2020 May 13

G

Gev in Moscow Spark

Народ, подскажите
Я поднял на сервере в докере ванильный HADOOP в singlnode и туда на HDFS положил файлег
С сервера читаю его в в spark-shell без проблем
Пытаюсь с локальной машинки прочитать а мне выдается :
java.io.IOException: Could not read footer for file и полный путь к файлику
Порт и сервер, к которому коннекчусь - прокинуты и читаются но похоже какой то касяк с доступом или может я чтото не так прописал при попытке достучаться до файла
Может у кого то есьт опыт таких плясок с бубном
Ванильный HADOOP в докере на удаленном сервере

источник

15:47пожаловаться #5

PL

Pavel L in Moscow Spark

Всем привет! Был бы очень благодарен, если кто-то поделится успешным опытом использования Snowflake вместе со Spark-ом.

Есть некоторые Snowflake специфичные вопросы с которыми столкнулся и документация никак не помогает в них, а именно query queued time / execution time - который неожиданно очень сильно растет если использовать SF из Спарка

Заранее спасибо!

источник

15:50пожаловаться #6

K

KrivdaTheTriewe in Moscow Spark

источник

23:37пожаловаться #7

GP

Grigory Pomadchin in Moscow Spark

KrivdaTheTriewe

очень плохо

источник

23:38пожаловаться #8

K

KrivdaTheTriewe in Moscow Spark

Grigory Pomadchin

очень плохо

я может в танке, а при каких ситуациях отрицательное число тасок

источник

23:38пожаловаться #9

2020 May 14

GP

Grigory Pomadchin in Moscow Spark

KrivdaTheTriewe

я может в танке, а при каких ситуациях отрицательное число тасок

когда ты не очень продуктивен

источник

01:20пожаловаться #10

PK

Pavel Klemenkov in Moscow Spark

А вот и анонсик Spark on GPU https://m.youtube.com/watch?list=PLZHnYvH1qtOZ2BSwG4CHmKSVHxC2lyIPL&v=tpeGZ7nm0J0&index=3

NVIDIA GTC 2020 Keynote Part 3: GPU Accelerating HPC and Scientific Computing

NVIDIA CEO Jensen Huang describes how NVIDIA GPU acceleration is the path forward for #HPC and scientific computing, which now boasts 700+ CUDA-accelerated applications. Learn about the importance of recommendation systems and how NVIDIA and Mellanox technologies combine to deliver 5x the price-performance on Spark compared to current CPU systems. Databricks and other major cloud analytics platforms are now accelerated with NVIDIA. #GTC20

Learn more about GPU-accelerated Spark 3.0 at www.nvidia.com/spark.

источник

18:19пожаловаться #11

GP

Grigory Pomadchin in Moscow Spark

Pavel Klemenkov

А вот и анонсик Spark on GPU https://m.youtube.com/watch?list=PLZHnYvH1qtOZ2BSwG4CHmKSVHxC2lyIPL&v=tpeGZ7nm0J0&index=3

NVIDIA GTC 2020 Keynote Part 3: GPU Accelerating HPC and Scientific Computing

NVIDIA CEO Jensen Huang describes how NVIDIA GPU acceleration is the path forward for #HPC and scientific computing, which now boasts 700+ CUDA-accelerated applications. Learn about the importance of recommendation systems and how NVIDIA and Mellanox technologies combine to deliver 5x the price-performance on Spark compared to current CPU systems. Databricks and other major cloud analytics platforms are now accelerated with NVIDIA. #GTC20

Learn more about GPU-accelerated Spark 3.0 at www.nvidia.com/spark.

круто что они вкладываются в это

источник

18:26пожаловаться #12

GP

Grigory Pomadchin in Moscow Spark

может родится новый ‘спарк’ в итоге

источник

18:26пожаловаться #13

PK

Pavel Klemenkov in Moscow Spark

Grigory Pomadchin

может родится новый ‘спарк’ в итоге

Ну он, по факту, уже есть при чём, что радует, если оператор не реализован на gpu, то он не падает, а продолжает работать на CPU. В отличие от даска того же

источник

18:29пожаловаться #14

GP

Grigory Pomadchin in Moscow Spark

Pavel Klemenkov

Ну он, по факту, уже есть при чём, что радует, если оператор не реализован на gpu, то он не падает, а продолжает работать на CPU. В отличие от даска того же

очень хорошо; а будет все у опенсурсе?

источник

18:30пожаловаться #15

GP

Grigory Pomadchin in Moscow Spark

а удобоно использовать? стоит ли ждать нового распределенного фреймворка или пока все же он топ оф спарк планируют?

источник

18:31пожаловаться #16

R

Renarde in Moscow Spark

Pavel Klemenkov

Ну он, по факту, уже есть при чём, что радует, если оператор не реализован на gpu, то он не падает, а продолжает работать на CPU. В отличие от даска того же

А есть какие-нибудь бенчмарки вроде vanilla vs gpu? На TPC-H скажем

источник

18:56пожаловаться #17

PK

Pavel Klemenkov in Moscow Spark

А есть какие-нибудь бенчмарки вроде vanilla vs gpu? На TPC-H скажем

Есть, но пока внутри

источник

19:01пожаловаться #18

PK

Pavel Klemenkov in Moscow Spark

Grigory Pomadchin

а удобоно использовать? стоит ли ждать нового распределенного фреймворка или пока все же он топ оф спарк планируют?

Как обычный спарк. Ну и с десяток опций как обычно )

источник

19:01пожаловаться #19

R

Renarde in Moscow Spark

Pavel Klemenkov

Есть, но пока внутри

да-да, я нашел (тоже внутри 😁)

источник

19:02пожаловаться #20