Sa
хочу записать спарком датафрейм чтобы было 300 партиций
(
spark
.table('db.table1')
.repartition(300)
.write
.saveAsTable('db.table2', mode='overwrite')
)
spark.table('db.table2').rdd.getNumPartitions() # 37
а он сохраняет 37
как фиксить?
Size: a a a
Sa
(
spark
.table('db.table1')
.repartition(300)
.write
.saveAsTable('db.table2', mode='overwrite')
)
spark.table('db.table2').rdd.getNumPartitions() # 37
A🦕
zipWithIndex`/`zipWithUniqueId
Sa
PK
Sa
Sa
PK
Sa
Sa
A🦕
PK
PK
ЕГ
Sa
A🦕
PK
А
N
N
PK