Size: a a a

2019 February 13

AL

Alex Lu in Moscow Spark
Выглядит вполне логичным на запрос "выдай выражение 0" выдавать 0:)
источник

AA

Anton Alekseev in Moscow Spark
Alex Lu
Выглядит вполне логичным на запрос "выдай выражение 0" выдавать 0:)
Я пробовал в кавычки еще одни завернуть, таже петрушка
источник

AL

Alex Lu in Moscow Spark
Anton Alekseev
Я пробовал в кавычки еще одни завернуть, таже петрушка
В таком случае он выдает не 0, а "0"
источник

AL

Alex Lu in Moscow Spark
Тоже логично)
источник

AA

Anton Alekseev in Moscow Spark
Alex Lu
Тоже логично)
Окей, как обратиться к пространству имён колонок)
источник

AA

Anton Alekseev in Moscow Spark
Юзера же как-то распарсил
источник

AL

Alex Lu in Moscow Spark
Я думал, что он это делает, если не находит константу (или функцию). А вот минуя их - непонятно.
источник

DN

Dmitrii Nosov in Moscow Spark
Anton Alekseev
Окей, как обратиться к пространству имён колонок)

selectExpr("`0`")

- так, может (в бэктиках)?
источник

AA

Anton Alekseev in Moscow Spark
Dmitrii Nosov

selectExpr("`0`")

- так, может (в бэктиках)?
Да, есть. Спасибо. Вы это в доках нашли?
источник

DN

Dmitrii Nosov in Moscow Spark
В чертогах разума. 😆
источник

НК

Николай Корсаков... in Moscow Spark
А чем select(col(“0”)) не угодил?
источник

DN

Dmitrii Nosov in Moscow Spark
Вроде бы, в SQL то, что в бэктиках, есть имя колонки. По аналогии тут.
источник

AA

Anton Alekseev in Moscow Spark
Николай Корсаков
А чем select(col(“0”)) не угодил?
Я пытаюсь ускорить, реализацию melt (по ссылке), и хочу попробовать через sql. Ибо реализация через col(name) на этапе формирования _vars_and_vals (по ссылке) проседает по перфомансу. https://stackoverflow.com/questions/41670103/how-to-melt-spark-dataframe
источник

AA

Anton Alekseev in Moscow Spark
у меня жирнющщий фрейм
источник

PK

Pavel Klemenkov in Moscow Spark
Anton Alekseev
Да, есть. Спасибо. Вы это в доках нашли?
Это стандартная конвенция в SQL
источник

AA

Anton Alekseev in Moscow Spark
Pavel Klemenkov
Это стандартная конвенция в SQL
Запамятовал значит, привык через [], либо вообще без обособления. MSsql (MStudio точнее) переваривает.
источник

AA

Anton Alekseev in Moscow Spark
Anton Alekseev
Я пытаюсь ускорить, реализацию melt (по ссылке), и хочу попробовать через sql. Ибо реализация через col(name) на этапе формирования _vars_and_vals (по ссылке) проседает по перфомансу. https://stackoverflow.com/questions/41670103/how-to-melt-spark-dataframe
Ну кстати в моём случае это значительно ускорило преобразование. Если понадобится кому, то на стак добавил реализацию.
источник
2019 February 19

N

Nikolay in Moscow Spark
Подскажите , как понимать Dataset. Интересуют именно детали. Вот с rdd более или менее понятно. Это интерфейс  с одной из функцией -compute , которая возвращает итератор. А как быть с dataset?
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
Подскажите , как понимать Dataset. Интересуют именно детали. Вот с rdd более или менее понятно. Это интерфейс  с одной из функцией -compute , которая возвращает итератор. А как быть с dataset?
Тож самое; только оно умеет интерпретировать и упрощать по мере возможности планы запросов, чего не умеет рдд и в рдд надо руками все делать. Однако мне не понятно на сколько сказанное выше ясно сказано т.к. первый раз вижу такое описание рдд
источник

GP

Grigory Pomadchin in Moscow Spark
источник