Телеграмм чат группы moscowspark страница 75

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Moscow Spark

872 membersпожаловаться на группу

1
«
…
‹
70
71
72
73
74
75
76
›
…
»

2018 November 22

AA

Anton Alekseev in Moscow Spark

Спасибо

источник

17:47пожаловаться #1

SK

Sergey Karpiy in Moscow Spark

Anton Alekseev

Спасибо

На здоровье

источник

17:53пожаловаться #2

2018 November 23

PK

Pavel Klemenkov in Moscow Spark

источник

14:31пожаловаться #3

PK

Pavel Klemenkov in Moscow Spark

Moscow Spark #6 уже совсем скоро, 14 декабря в офисе МегаФона https://moscowspark.timepad.ru/event/860257/

moscowspark.timepad.ru

Moscow Spark #6 / События на TimePad.ru

Всем привет! Скоро Новый Год и Moscow Spark несет подарочек под вашу Big Data елочку - шестую итерацию нашего митапа! Годный контент, отличная компания, шикарная площадка, стихийное афтепати.

источник

14:31пожаловаться #4

ЛР

Лев Рагулин... in Moscow Spark

источник

14:55пожаловаться #5

AA

Anton Alekseev in Moscow Spark

Ребята, подскажите такую манипуляцию как добавить последовательные индексы на куждую строку в спарке оптимально можно сделать только так?: https://forums.databricks.com/questions/8180/how-to-merge-two-data-frames-column-wise-in-apache.html

How to merge two data frames column-wise in Apache Spark - Databricks Community Forum

A community forum to discuss working with Databricks Cloud and Spark

источник

16:35пожаловаться #6

AA

Anton Alekseev in Moscow Spark

пример задачи в панде:

>>> df
   0   1
0  1   2
1  3   4
2  5   6
3  7   8
4  9  10
>>> df[2] = range(0, df.shape[0])
>>> df
   0   1  2
0  1   2  0
1  3   4  1
2  5   6  2
3  7   8  3
4  9  10  4

источник

16:35пожаловаться #7

AA

Anton Alekseev in Moscow Spark

Джойнить через monotonically_increasing_id() выглядит крайне не безопасно, как по мне

источник

16:36пожаловаться #8

AS

Andrey Smirnov in Moscow Spark

Anton Alekseev

Джойнить через monotonically_increasing_id() выглядит крайне не безопасно, как по мне

там есть присказака что они должны быть одного размера, но даже в этом случае колво партиций может не совпадать и тогда будет бред

источник

16:38пожаловаться #9

AA

Anton Alekseev in Moscow Spark

там есть присказака что они должны быть одного размера, но даже в этом случае колво партиций может не совпадать и тогда будет бред

вот, да я как раз об этом.

источник

16:38пожаловаться #10

AS

Andrey Smirnov in Moscow Spark

import org.apache.spark.sql.expressions.Window;
df.withColumn("id",row_number().over(Window.orderBy("a column")))
можно так

источник

16:39пожаловаться #11

AS

Andrey Smirnov in Moscow Spark

я делал через zipWithIndex, но это не однострочник :)

источник

16:39пожаловаться #12

AA

Anton Alekseev in Moscow Spark

import org.apache.spark.sql.expressions.Window;
df.withColumn("id",row_number().over(Window.orderBy("a column")))
можно так

это java/scala?

источник

16:40пожаловаться #13

AA

Anton Alekseev in Moscow Spark

окей поищу аналог

источник

16:40пожаловаться #14

AA

Anton Alekseev in Moscow Spark

для py

источник

16:40пожаловаться #15

R

Rogoley in Moscow Spark

тоже самое, только импорт окна будет из другого модуля

источник

16:41пожаловаться #16

AA

Anton Alekseev in Moscow Spark

тоже самое, только импорт окна будет из другого модуля

ок, спасибо.

источник

16:41пожаловаться #17

R

Rogoley in Moscow Spark

from pyspark.sql.window import Window

источник

16:41пожаловаться #18

R

Rogoley in Moscow Spark

orderBy("a column") и тут колонку нужную указать

источник

16:42пожаловаться #19

D

Dima in Moscow Spark

Можно сделать через Union+group by

источник

16:43пожаловаться #20

1
«
…
‹
70
71
72
73
74
75
76
›
…
»