Size: a a a

2020 August 31

GP

Grigory Pomadchin in Moscow Spark
Это сообщение удалила сама телега
источник

GP

Grigory Pomadchin in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
О_о
А чо, так можно было?
источник
2020 September 01

Н

Никита in Moscow Spark
а кто-нибудь знает как прочить gzip файл, если в его пути нет расширения .gz
источник

T

T in Moscow Spark
Никита
а кто-нибудь знает как прочить gzip файл, если в его пути нет расширения .gz
отнаследоваться от GzipCodec и заоврерайдить getDefaultExtension на пример
источник

Н

Никита in Moscow Spark
а это в pysparkе можно сделать?
источник
2020 September 02

ПБ

Повелитель Бури... in Moscow Spark
Добрый вечер, коллеги! скажите пожалуйста.
у меня есть 5 машинок  со спарком

я запускаю команду, и как можно узнать, что все ресурсы максимально утилизированы для данной задачи (т.е. что все 5 машинок работают?)
Это yarn ? ккие -то логи? спасибо
источник

AS

Andrey Smirnov in Moscow Spark
Повелитель Бури
Добрый вечер, коллеги! скажите пожалуйста.
у меня есть 5 машинок  со спарком

я запускаю команду, и как можно узнать, что все ресурсы максимально утилизированы для данной задачи (т.е. что все 5 машинок работают?)
Это yarn ? ккие -то логи? спасибо
spark ui, а так хоть ganglia поставить можно
источник

PK

Pavel Klemenkov in Moscow Spark
Повелитель Бури
Добрый вечер, коллеги! скажите пожалуйста.
у меня есть 5 машинок  со спарком

я запускаю команду, и как можно узнать, что все ресурсы максимально утилизированы для данной задачи (т.е. что все 5 машинок работают?)
Это yarn ? ккие -то логи? спасибо
Во вкладке executors в spark ui указаны хосты, на которых запущены экзекьюторы и выделенные ресурсы
источник

ПБ

Повелитель Бури... in Moscow Spark
Pavel Klemenkov
Во вкладке executors в spark ui указаны хосты, на которых запущены экзекьюторы и выделенные ресурсы
оно?
https://prnt.sc/uaazk9
History Server
источник

PK

Pavel Klemenkov in Moscow Spark
Кажется, что нет. Это же интерфейс амбари или клаудеры
источник

AS

Alexander Salkov in Moscow Spark
На History Server UI нажмите и там то, о чем писали.
источник

ME

Mikhail Epikhin in Moscow Spark
Привет. Ребят, а кто-то в курсе почему модуль интеграции kafka со спарком не идет в стандартной поставке? Почему он просто не лежит джарником вместе со спарком? Почему надо каждый раз указывать как зависимоссть?

./bin/spark-submit --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.0.0 ...

https://spark.apache.org/docs/3.0.0/structured-streaming-kafka-integration.html#deploying
источник

ЕГ

Евгений Глотов... in Moscow Spark
Mikhail Epikhin
Привет. Ребят, а кто-то в курсе почему модуль интеграции kafka со спарком не идет в стандартной поставке? Почему он просто не лежит джарником вместе со спарком? Почему надо каждый раз указывать как зависимоссть?

./bin/spark-submit --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.0.0 ...

https://spark.apache.org/docs/3.0.0/structured-streaming-kafka-integration.html#deploying
Кафки разные, под них разные версии либы
источник

ME

Mikhail Epikhin in Moscow Spark
Евгений Глотов
Кафки разные, под них разные версии либы
я вижу только 0-8 и 0-10, в третьей версии только 0-10
источник

GP

Grigory Pomadchin in Moscow Spark
Mikhail Epikhin
Привет. Ребят, а кто-то в курсе почему модуль интеграции kafka со спарком не идет в стандартной поставке? Почему он просто не лежит джарником вместе со спарком? Почему надо каждый раз указывать как зависимоссть?

./bin/spark-submit --packages org.apache.spark:spark-sql-kafka-0-10_2.12:3.0.0 ...

https://spark.apache.org/docs/3.0.0/structured-streaming-kafka-integration.html#deploying
не всем нужна кафка
источник

ME

Mikhail Epikhin in Moscow Spark
Евгений Глотов
Кафки разные, под них разные версии либы
я так понимаю что 0-10 совместима с текущими актуальными 2.x
источник

ME

Mikhail Epikhin in Moscow Spark
Grigory Pomadchin
не всем нужна кафка
ну блин, не всем нужен mllib, но его же пихают везде
источник

ME

Mikhail Epikhin in Moscow Spark
или graphx
источник

GP

Grigory Pomadchin in Moscow Spark
Mikhail Epikhin
ну блин, не всем нужен mllib, но его же пихают везде
его (xml) не пихают в скале везде, это отдельная зависимость
источник