Size: a a a

2019 October 13

ЕГ

Евгений Глотов... in Moscow Spark
И по ним колонки строятся
источник

ЕГ

Евгений Глотов... in Moscow Spark
Или нет?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Пивот позволяет развернуть одну колонку во много колонок
источник

ТС

Тимофей Смирнов... in Moscow Spark
Евгений Глотов
24 подгруппы?
по сути да
источник

ЕГ

Евгений Глотов... in Moscow Spark
Groupby(groupby_col).pivot(pivot_col).agg(sum(x).alias(sum_x, sum(y).alias(y)) создаст транспонированный агрегат
источник

ЕГ

Евгений Глотов... in Moscow Spark
Например, в pivot_col значения могут быть v1, v2, v3
источник

ЕГ

Евгений Глотов... in Moscow Spark
Будет на выходе датафрейм, сгруппированный по groupby_col, и будут колонки v1_sum_x, v1_sum_y, v2_sum_x, v2_sum_y, v3_sum_x, v3_sum_y
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вместо фильтров where v1 или v2 или v3, потом джойна этих трёх датафреймов
источник

ЕГ

Евгений Глотов... in Moscow Spark
А впрочем что я тут фигню несу, есть же крутая статья, в которой всё расписано)
https://databricks.com/blog/2016/02/09/reshaping-data-with-pivot-in-apache-spark.html
источник

ТС

Тимофей Смирнов... in Moscow Spark
спасибо большое
источник

ТС

Тимофей Смирнов... in Moscow Spark
буду пробовать
источник
2019 October 15

PK

Pavel Klemenkov in Moscow Spark
источник

PK

Pavel Klemenkov in Moscow Spark
Всем привет)
источник

K

KrivdaTheTriewe in Moscow Spark
круто
источник

KS

Kostya Shchetkin in Moscow Spark
можно moscow spark провести, судя по кол-ву десанта
источник

PK

Pavel Klemenkov in Moscow Spark
Да, у нас полсамолета сюда прилетело)
источник

PK

Pavel Klemenkov in Moscow Spark
Попробуем организоваться и вести небольшие лайвы по итогам дня.
источник

AA

Anton Alekseev in Moscow Spark
Периодически в ходе исполнения вываливается ошибка в yarn логи -
ERROR org.apache.hadoop.yarn.server.resourcemanager.ResourceManager: RECEIVED SIGNAL 15: SIGTERM
ERROR org.apache.hadoop.security.token.delegation.AbstractDelegationTokenSecretManager: ExpiredTokenRemover received java.lang.InterruptedException: sleep interrupted.
Гугол не хочет помогать, сталкивался кто?
источник

KS

Kostya Shchetkin in Moscow Spark
Anton Alekseev
Периодически в ходе исполнения вываливается ошибка в yarn логи -
ERROR org.apache.hadoop.yarn.server.resourcemanager.ResourceManager: RECEIVED SIGNAL 15: SIGTERM
ERROR org.apache.hadoop.security.token.delegation.AbstractDelegationTokenSecretManager: ExpiredTokenRemover received java.lang.InterruptedException: sleep interrupted.
Гугол не хочет помогать, сталкивался кто?
новый кластер разворачваешь?
источник

AA

Anton Alekseev in Moscow Spark
Kostya Shchetkin
новый кластер разворачваешь?
да, из снапшотов
источник