Size: a a a

2021 February 12

ПФ

Паша Финкельштейн... in Moscow Spark
Мне надо по окну найти все вхождения
источник

ПФ

Паша Финкельштейн... in Moscow Spark
типа select count(x) where x=3
источник

VS

Vladislav 👻 Shishkov... in Moscow Spark
having?
источник

VS

Vladislav 👻 Shishkov... in Moscow Spark
И это не совсем по окну, на сколько я понимаю
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А мне вот надо по окну 😞
источник

А

Алексей in Moscow Spark
в подзапрос его и фильтр сверху
источник

VS

Vladislav 👻 Shishkov... in Moscow Spark
Ты делаешь каунт по окну, а потом условия по каунту
источник

А

Алексей in Moscow Spark
продолжаем играть в вангу: case when для фильтрации внутри окна
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Алексей
продолжаем играть в вангу: case when для фильтрации внутри окна
Ща я пример набросаю
(1, "a"),
(2, "b"),
(3, "a")
,
(4, "a"),

Хочу добавить колонку, в которой будет написано сколько раз на предыдущих двух строках встретилась строка из второй колонки
источник

ПФ

Паша Финкельштейн... in Moscow Spark
то есть в этом примере в третьей колонке будет
0
0
1
1
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Интуитивно кажется что это должно быть просто, но как это сделать в спарке я не понимаю
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Окно ж нельзя представить как датафрейм?
источник

e

er@essbase.ru in Moscow Spark
Паша Финкельштейн
Ща я пример набросаю
(1, "a"),
(2, "b"),
(3, "a")
,
(4, "a"),

Хочу добавить колонку, в которой будет написано сколько раз на предыдущих двух строках встретилась строка из второй колонки
а как это должно работать в кластере ?
источник

e

er@essbase.ru in Moscow Spark
ты же не знаешь что там насчиталось на другом узле
источник

ПФ

Паша Финкельштейн... in Moscow Spark
er@essbase.ru
а как это должно работать в кластере ?
Ну Window.orderBy("_1").rowsBetween(-2, Window.currentRow)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Раз мы можем вычислить avg(_1) over window — значит это уже работает как-то 😊
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Понятно что у этого есть цена в дикий шафл, но уж если надо то надо.
источник

А

Алексей in Moscow Spark
Паша Финкельштейн
Ща я пример набросаю
(1, "a"),
(2, "b"),
(3, "a")
,
(4, "a"),

Хочу добавить колонку, в которой будет написано сколько раз на предыдущих двух строках встретилась строка из второй колонки
BETWEEN 2 PRECEDING AND CURRENT ROW
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Это вроде синоним https://t.me/moscowspark/14123?
источник

А

Алексей in Moscow Spark
возможно, я такое до этого только на sql писал
источник