Size: a a a

2018 October 19

GP

Grigory Pomadchin in Moscow Spark
плюсую Павла
источник

AT

Andrey Tsibulskiy in Moscow Spark
Подскажите,а что именно не так? Если не секрет
источник

MV

Mitya Volodin in Moscow Spark
Andrey Tsibulskiy
Подскажите,а что именно не так? Если не секрет
Ну вот да, хочу отзывы про шлаковость 😁 @pklemenkov
источник

PK

Pavel Klemenkov in Moscow Spark
Andrey Tsibulskiy
Подскажите,а что именно не так? Если не секрет
Ну те тулы, которые я пробовал умеют только базовый функционал dq. Моды там посчитать, средние, стандартные отклонения. Инференса типов нет. Стат тестов на одиночные случайные величины нет, на совместные распределения нескольких случайных величин вообще нифига нет.
источник

D

Dima in Moscow Spark
Вопрос по поводу Спарка 2.2
У нас все приложения запускаются с spark.sql.hive.convertMetastoreParquet=false. admin говорит что тогда срарк не сканирует все паркет файлы чтобы добыть метадату , а берет метаданные с метастора. Интересно знать какое значение у вас стоит?
источник

MV

Mitya Volodin in Moscow Spark
Pavel Klemenkov
Ну те тулы, которые я пробовал умеют только базовый функционал dq. Моды там посчитать, средние, стандартные отклонения. Инференса типов нет. Стат тестов на одиночные случайные величины нет, на совместные распределения нескольких случайных величин вообще нифига нет.
Спс!
источник

AT

Andrey Tsibulskiy in Moscow Spark
Pavel Klemenkov
Ну те тулы, которые я пробовал умеют только базовый функционал dq. Моды там посчитать, средние, стандартные отклонения. Инференса типов нет. Стат тестов на одиночные случайные величины нет, на совместные распределения нескольких случайных величин вообще нифига нет.
Спасибо за ответ
источник
2018 October 30

AA

Anton Alekseev in Moscow Spark
Ребят, понимаю что вопрос не совсем по теме, но как продиагностировать почему крашится spark-submit если статусы: "yarn application state Accepted -> yarn application state running -> yarn application state Accepted -> failed". А не по теме поскольку, как я понял проблемы с yarn, который не выделяет ресурсы.
источник

AA

Anton Alekseev in Moscow Spark
Проверил, ресурсы свободны, других запущенных app нет.
источник

AA

Anton Alekseev in Moscow Spark
ну и таже петрушка при тесте hadoop jar экземплов, так что как таковой связи со spark и нет совсем)
источник

t

tenKe in Moscow Spark
Anton Alekseev
Ребят, понимаю что вопрос не совсем по теме, но как продиагностировать почему крашится spark-submit если статусы: "yarn application state Accepted -> yarn application state running -> yarn application state Accepted -> failed". А не по теме поскольку, как я понял проблемы с yarn, который не выделяет ресурсы.
running > accepted это обычно в приложении ошибка
источник

t

tenKe in Moscow Spark
посмотрите yarn logs -applicationId <id>
источник

AA

Anton Alekseev in Moscow Spark
tenKe
посмотрите yarn logs -applicationId <id>
После того как переходит в статус Accepted из Running логи уже не может найти. так и должно быть?
источник

AA

Anton Alekseev in Moscow Spark
ну и в конечном итоге отвалилось по connection refused
источник

t

tenKe in Moscow Spark
Anton Alekseev
После того как переходит в статус Accepted из Running логи уже не может найти. так и должно быть?
нет
источник

PK

Pavel Klemenkov in Moscow Spark
Anton Alekseev
ну и в конечном итоге отвалилось по connection refused
На питоше код на спарке?
источник

PK

Pavel Klemenkov in Moscow Spark
Anton Alekseev
После того как переходит в статус Accepted из Running логи уже не может найти. так и должно быть?
Кажется в хадупе аггрегация логов отключена
источник

AA

Anton Alekseev in Moscow Spark
Pavel Klemenkov
На питоше код на спарке?
Сабмитю jar спарковские примеры (KMeans)
источник

AA

Anton Alekseev in Moscow Spark
Pavel Klemenkov
Кажется в хадупе аггрегация логов отключена
Они есть внутри одной апп для одного из контейнеров, для другого нет (2 создалось), это я на веб морде увидел. yarn не находит в консоли
источник

ЕС

Евгений Санников... in Moscow Spark
Веб-морде лучше не верить, а залезть физически на сервер и посмотреть
источник