Size: a a a

2020 November 09

K

KrivdaTheTriewe in Moscow Spark
а кто нибудь форкал себе спарк в гитлаб и заморачивался с CI ?
источник

GP

Grigory Pomadchin in Moscow Spark
KrivdaTheTriewe
а кто нибудь форкал себе спарк в гитлаб и заморачивался с CI ?
мы в дженкинс было дело форкали
источник

GP

Grigory Pomadchin in Moscow Spark
а в чем косяк? возьми их конфиг +- из открытой репы
источник

GP

Grigory Pomadchin in Moscow Spark
или не работает у тебя?
источник

K

KrivdaTheTriewe in Moscow Spark
Не, я ток начинаю
источник

K

KrivdaTheTriewe in Moscow Spark
прост мне файл придется добавить свой в репо, думаю как правильно ветвиться
источник

t

tenKe in Moscow Spark
Никто с таким не встречался? Как это фиксить? Пытаюсь на драйвере такое сделать:

val encoder = RowEncoder(someSchema)
val row = encoder.fromRow(someInternalRow)

падает с java.lang.RuntimeException: Error while decoding: java.lang.UnsupportedOperationException: Cannot evaluate expression: getcolumnbyordinal(0, LongType)
источник

t

tenKe in Moscow Spark
@pomadchin Гриииш? ^
источник

GP

Grigory Pomadchin in Moscow Spark
tenKe
@pomadchin Гриииш? ^
а можешь воспроихводимый пример намутить?)
источник

GP

Grigory Pomadchin in Moscow Spark
а то чет вазе непонятно)
источник
2020 November 10

SI

Sergey Ivanychev in Moscow Spark
Привет

А кто-то сталкивался с такой жестью в stderr экзекьютеров?

20/11/10 07:47:44 INFO CoarseGrainedExecutorBackend: eagerFSInit: Eagerly initialized FileSystem at s3://does/not/exist
источник

SI

Sergey Ivanychev in Moscow Spark
Возникло на версии EMR 5.29
источник

SI

Sergey Ivanychev in Moscow Spark
Очень мешает жить, так как мы де факто не получаем истинный бакет при создании кастомного CredentialsProvider
источник

t

tenKe in Moscow Spark
@pomadchin

import org.apache.spark.sql.catalyst.InternalRow
import org.apache.spark.sql.catalyst.encoders.{ExpressionEncoder, RowEncoder}
import org.apache.spark.sql.types.{StructType}

object Foo {

val df: Dataset[java.lang.Long] = spark.range(10)
val schema: StructType = df.schema
val internalRow: InternalRow = df.queryExecution.toRdd.first
val encoder: ExpressionEncoder[Row] = RowEncoder(schema)
val result: Row = encoder.fromRow(internalRow)

}

[info]   java.lang.RuntimeException: Error while decoding: java.lang.UnsupportedOperationException: Cannot evaluate expression: getcolumnbyordinal(0, LongType)
[info] createexternalrow(getcolumnbyordinal(0, LongType), StructField(id,LongType,false))
[info]   at org.apache.spark.sql.catalyst.encoders.ExpressionEncoder.fromRow(ExpressionEncoder.scala:305)
источник

t

tenKe in Moscow Spark
Примерно так
источник

t

tenKe in Moscow Spark
Ну а вообще я хочу из InternalRow получить Row, находясь на драйвере
источник

GP

Grigory Pomadchin in Moscow Spark
tenKe
@pomadchin

import org.apache.spark.sql.catalyst.InternalRow
import org.apache.spark.sql.catalyst.encoders.{ExpressionEncoder, RowEncoder}
import org.apache.spark.sql.types.{StructType}

object Foo {

val df: Dataset[java.lang.Long] = spark.range(10)
val schema: StructType = df.schema
val internalRow: InternalRow = df.queryExecution.toRdd.first
val encoder: ExpressionEncoder[Row] = RowEncoder(schema)
val result: Row = encoder.fromRow(internalRow)

}

[info]   java.lang.RuntimeException: Error while decoding: java.lang.UnsupportedOperationException: Cannot evaluate expression: getcolumnbyordinal(0, LongType)
[info] createexternalrow(getcolumnbyordinal(0, LongType), StructField(id,LongType,false))
[info]   at org.apache.spark.sql.catalyst.encoders.ExpressionEncoder.fromRow(ExpressionEncoder.scala:305)
мне кажется надо забиндить анкодер на стракт
источник

GP

Grigory Pomadchin in Moscow Spark
на схему т.е. у тебя
источник

GP

Grigory Pomadchin in Moscow Spark
RowEncoder(schema) ~> RowEncoder(schema).resolveAndBind()
источник

GP

Grigory Pomadchin in Moscow Spark
замени и мож заработает
источник