Size: a a a

2021 April 06

AK

Alena Korogodova in Moscow Spark
А что, если два дубля с NY?
источник

JF

Jane Frankenstein in Moscow Spark
вот
источник

JF

Jane Frankenstein in Moscow Spark
их нужно оставить
источник

JF

Jane Frankenstein in Moscow Spark
оставить всех с NY
источник

JF

Jane Frankenstein in Moscow Spark
даже если их 100
источник

N

Nikita Blagodarnyy in Moscow Spark
spark.sql(«select * from my_df_alias where name = ‘James’ and state = ‘NY’ or name != ‘James’»)
источник

ЕГ

Евгений Глотов... in Moscow Spark
А если нет NY?
источник

JF

Jane Frankenstein in Moscow Spark
NY всегда будет
источник

ЕГ

Евгений Глотов... in Moscow Spark
Тогда просто фильтрануть
источник

JF

Jane Frankenstein in Moscow Spark
не-а
источник

JF

Jane Frankenstein in Moscow Spark
пробовала
источник

JF

Jane Frankenstein in Moscow Spark
оставить всех только с NA нельзя
источник

JF

Jane Frankenstein in Moscow Spark
тогда уникальные другие пропадут
источник

ЕГ

Евгений Глотов... in Moscow Spark
Тогда NY не всегда есть)
источник

IS

Ilya Slesarev in Moscow Spark
Вопрос скорее в том, по каким полям определяется уникальность)
источник

JF

Jane Frankenstein in Moscow Spark
уникальность определяется по name, department
источник

JF

Jane Frankenstein in Moscow Spark
это ключ
источник

IS

Ilya Slesarev in Moscow Spark
Если name и department, то NY действительно есть не всегда
источник

JF

Jane Frankenstein in Moscow Spark
да, логично
источник

JF

Jane Frankenstein in Moscow Spark
может, у кого-то быть CA
источник