Size: a a a

2018 August 16

AA

Anton Alekseev in Moscow Spark
Добрый день. Задача обрабатывать относительно большие массивы данных с помощью спарка. Необходимые условия - развернуть все в aws (либо на инстансах, либо работать через aws Glue), и при этом иметь автоматическое масштабирование в зависимости от нагрузки. Вроде aws Glue для всего этого выглядит оптимальным решением. Был у кого опыт с aws glue? Поделитесь впечатлениями. (непосредственно тем что касается разработки под спарк внутри)
источник
2018 August 21

AP

Alexander Piminov in Moscow Spark
Anton Alekseev
Добрый день. Задача обрабатывать относительно большие массивы данных с помощью спарка. Необходимые условия - развернуть все в aws (либо на инстансах, либо работать через aws Glue), и при этом иметь автоматическое масштабирование в зависимости от нагрузки. Вроде aws Glue для всего этого выглядит оптимальным решением. Был у кого опыт с aws glue? Поделитесь впечатлениями. (непосредственно тем что касается разработки под спарк внутри)
А чем не подходит EMR и vanilla Spark?
источник

AA

Anton Alekseev in Moscow Spark
Alexander Piminov
А чем не подходит EMR и vanilla Spark?
Да, уже сами пришли к этому, но все равно спасибо))
источник
2018 August 27

PK

Pavel Klemenkov in Moscow Spark
Всем привет! Такое дело, у меня в команде открылись две вакансии Senior Spark Engineer и Spark Engineer. Будем рады вашим резюме, могу отвечать на вопросы ))
https://nvidia.wd5.myworkdayjobs.com/NVIDIAExternalCareerSite/job/Russia-Moscow/Data-Scientist_JR1909912
https://nvidia.wd5.myworkdayjobs.com/NVIDIAExternalCareerSite/job/Russia-Moscow/Spark-Engineer_JR1917272
источник
2018 September 05

N

Nikolay in Moscow Spark
Привет всем. Почему импала часто  быстрее Спарка?
источник

ЛР

Лев Рагулин... in Moscow Spark
Nikolay
Привет всем. Почему импала часто  быстрее Спарка?
Привет. Потому что job не тюнили.
источник

ЛР

Лев Рагулин... in Moscow Spark
Мы проводили тесты : импала не быстрее, жрет больше памяти, чаще падает по EOM и black box
источник

AK

Alexander K. in Moscow Spark
армяне лучше чем грузины! Чем? -Чем грузины!
источник

ЛР

Лев Рагулин... in Moscow Spark
Alexander K.
армяне лучше чем грузины! Чем? -Чем грузины!
Точно 😀
источник

TB

Torlin Bios in Moscow Spark
А у нас импала всегда быстрее чем хайв на Спарке. Но используем только для анализа. Для создания, переливания хайв будет надёжнее
источник

N

Nikolay in Moscow Spark
Если жрет память импала, то может она кешировать много пытается
источник

S

Stanislav in Moscow Spark
Nikolay
Привет всем. Почему импала часто  быстрее Спарка?
Выборки большие? На мелких может и быстрее по кешам
источник

ЕГ

Евгений Глотов... in Moscow Spark
Torlin Bios
А у нас импала всегда быстрее чем хайв на Спарке. Но используем только для анализа. Для создания, переливания хайв будет надёжнее
Не путайте спарк и хайв на спарке. Хайв днище, от него только метастор полезен
источник

NC

Nick Chervov in Moscow Spark
Евгений Глотов
Не путайте спарк и хайв на спарке. Хайв днище, от него только метастор полезен
👍
источник

N

Nikolay in Moscow Spark
источник

AV

Alexander Volinski in Moscow Spark
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вам удавалось поддерживать его в работоспособном состоянии больше недели? Он не восстанавливает контейнеры, когда их число доходит до минимума, апликейшен валится
источник

N

Nikolay in Moscow Spark
Покритикуйте направление мысли. Импала держит на каждой годе демонов - impalad. В этом уже есть выигрыш на маленьких запросах. При запуске Спарк джобы yarn, например , создаст сначала application, и уже этому applucation выдаст воркеров. Т.е нужно как минимум один раз jvm поднять на кластере.
источник

S

Stanislav in Moscow Spark
Евгений Глотов
Вам удавалось поддерживать его в работоспособном состоянии больше недели? Он не восстанавливает контейнеры, когда их число доходит до минимума, апликейшен валится
Кстати было такое. Сначала падал раз в неделю, сейчас около месяца аптайма без нареканий. Но и нагрузки особой нет
источник

AV

Alexander Volinski in Moscow Spark
Евгений Глотов
Вам удавалось поддерживать его в работоспособном состоянии больше недели? Он не восстанавливает контейнеры, когда их число доходит до минимума, апликейшен валится
У меня крайне мало опыта непосредственно с llap. Ссылка как пример, что на каждую статью от cloudera есть похожая от Hortonworks.
источник