Телеграмм чат группы moscowspark страница 398

#spark #SparkAISummit Сегодня начинается Spark Summit + AI'20. На прошлом я был докладчиком https://databricks.com/speaker/alexey-zinovev

В этом году буду внимательно следить за треком по Deep Learning, а также кишочками Spark.

Ближайшие три дня буду тут делиться мыслями в режиме non-stop, под настроение.

Databricks

Alexey Zinovyev - Databricks

Just as Charon from the Greek myths, Alexey helps people to get from one side to the other, the sides...

источник

19:11пожаловаться #14

ПФ

Паша Финкельштейн... in Moscow Spark

https://github.com/lynxkite/lynxkite

GitHub

lynxkite/lynxkite

The complete graph data science platform. Contribute to lynxkite/lynxkite development by creating an account on GitHub.

источник

20:08пожаловаться #15

2020 June 26

Mikhail Epikhin in Moscow Spark

Привет, а кто чем поднимал HDP на aws / gcp / azure?
Чем пользовались? cloudbreak, terraform + marketplace? anything else?
Поделитесь опытом:)

источник

16:06пожаловаться #16

Pavel Klemenkov in Moscow Spark

@datamove

источник

16:13пожаловаться #17

Datamove in Moscow Spark

Привет!
На этих платформах есть haoop-on-demand, т.е. в AWS - EMR, в GCP - Dataproc, в азуре - тоже что-то - ими пользоваться предпочтительнее, для батчевых задач.
Cloudbreak - как я понимаю, требует лицензию?
terraform - может развернуть кластер в любом облаке, и это очень удобный инструмент, но не решает задачи развертывания HDP на нем. Может быть у него и есть маркетплейс для всего, но мне кажется приклеивать к нему установку HDP - лишнее, не в идеологии терраформа, как минимум.
Вообще, не знаю, стоит ли вкладывать время в автоматизацию развертывания кластера на HDP. Куча усилий, чтоб получить спарк 2.3? Я бы сейчас смотрел в сторону arenadata, кажется читал хорошее об автоматизации сборки и развертывания диструбутива

источник

16:24пожаловаться #18

Mikhail Epikhin in Moscow Spark

>На этих платформах есть haoop-on-demand, т.е. в AWS - EMR, в GCP - Dataproc, в азуре - тоже что-то - ими пользоваться предпочтительнее, для батчевых задач.
Я в курсе, да.
На одном из проектов заказчик хочет HDP конкретной старой версии

источник

16:24пожаловаться #19

Mikhail Epikhin in Moscow Spark

>Может быть у него и есть маркетплейс для всего, но мне кажется приклеивать к нему установку HDP - лишнее, не в идеологии терраформа, как минимум.
Ну вклеивать это в terraform не надо. Можно же поставить базовый HDP + Ambari, а дальше уже через Ambari пошли/поехали.

источник

16:26пожаловаться #20