Size: a a a

2020 April 04

N

Nikolay in Moscow Spark
в какой строке
источник

GP

Grigory Pomadchin in Moscow Spark
Паша Финкельштейн
java.lang.NullPointerException: Null value appeared in non-nullable field:
top level Product or row object
If the schema is inferred from a Scala tuple/case class, or a Java bean, please try to use scala.Option[_] or other nullable types (e.g. java.lang.Integer instead of int/scala.Int).
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.serializefromobject_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.mapelements_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.agg_doAggregateWithKeys_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
 at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
 at org.apache.spark.sql.execution.WholeStageCodegenExec$$anon$1.hasNext(WholeStageCodegenExec.scala:729)
 at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:458)
 at org.apache.spark.shuffle.sort.BypassMergeSortShuffleWriter.write(BypassMergeSortShuffleWriter.java:132)
 at org.apache.spark.shuffle.ShuffleWriteProcessor.write(ShuffleWriteProcessor.scala:59)
 at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
 at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:52)
 at org.apache.spark.scheduler.Task.run(Task.scala:127)
 at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$3(Executor.scala:460)
 at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1377)
 at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:463)
 at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
 at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
 at java.base/java.lang.Thread.run(Thread.java:834)
вот
источник

GP

Grigory Pomadchin in Moscow Spark
трейс
источник

GP

Grigory Pomadchin in Moscow Spark
Паша Финкельштейн
java.lang.NullPointerException: Null value appeared in non-nullable field:
top level Product or row object
If the schema is inferred from a Scala tuple/case class, or a Java bean, please try to use scala.Option[_] or other nullable types (e.g. java.lang.Integer instead of int/scala.Int).
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.serializefromobject_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.mapelements_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.agg_doAggregateWithKeys_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
 at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)
 at org.apache.spark.sql.execution.WholeStageCodegenExec$$anon$1.hasNext(WholeStageCodegenExec.scala:729)
 at scala.collection.Iterator$$anon$10.hasNext(Iterator.scala:458)
 at org.apache.spark.shuffle.sort.BypassMergeSortShuffleWriter.write(BypassMergeSortShuffleWriter.java:132)
 at org.apache.spark.shuffle.ShuffleWriteProcessor.write(ShuffleWriteProcessor.scala:59)
 at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:99)
 at org.apache.spark.scheduler.ShuffleMapTask.runTask(ShuffleMapTask.scala:52)
 at org.apache.spark.scheduler.Task.run(Task.scala:127)
 at org.apache.spark.executor.Executor$TaskRunner.$anonfun$run$3(Executor.scala:460)
 at org.apache.spark.util.Utils$.tryWithSafeFinally(Utils.scala:1377)
 at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:463)
 at java.base/java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1128)
 at java.base/java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:628)
 at java.base/java.lang.Thread.run(Thread.java:834)
конечно надо бы обновить трейс чтоб он совпадал с минимальным примером
источник

GP

Grigory Pomadchin in Moscow Spark
а то этот я так понимаю старый
источник

N

Nikolay in Moscow Spark
private void serializefromobject_doConsume_0(org.jetbrains.spark.api.examples.Arity1 serializefromobject_expr_0_0, boolean serializefromobject_exprIsNull_0_0) throws java.io.IOException {
/* 086 */     if (serializefromobject_exprIsNull_0_0) {
/* 087 */       throw new NullPointerException(((java.lang.String) references[2] /* errMsg */));
/* 088 */     }
источник

N

Nikolay in Moscow Spark
это не оно?
источник

GP

Grigory Pomadchin in Moscow Spark
мне кажется что мы не там смотрим
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Nikolay
Паша, где у тебя падает?
момент
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Nikolay
Паша, где у тебя падает?
If the schema is inferred from a Scala tuple/case class, or a Java bean, please try to use scala.Option[_] or other nullable types (e.g. java.lang.Integer instead of int/scala.Int).
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.serializefromobject_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.mapelements_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.deserializetoobject_doConsume_0$(Unknown Source)
 at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Морри, господа, я отъезжал и вот вернулся
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Готов работать дальше
источник

GP

Grigory Pomadchin in Moscow Spark
у меня есть идея сча тест попробую набросать
источник

GP

Grigory Pomadchin in Moscow Spark
мне кажется что кидает анкодер
источник

GP

Grigory Pomadchin in Moscow Spark
значит надо поймать где экспрешн не такой
источник

GP

Grigory Pomadchin in Moscow Spark
вдруг получится
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Grigory Pomadchin
попробуй откатиться до 3.0; мастер скуль чето не запаблишился у мя свалился
там надо mvn install -DskipTests
источник

N

Nikolay in Moscow Spark
значит падает в serializefromobject_doConsume_0$(Unknown Source)
источник

GP

Grigory Pomadchin in Moscow Spark
Паша Финкельштейн
там надо mvn install -DskipTests
а я так и сделал чето чексумма какаято не совпадает и я забил пока
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Я сейчас попробую собрать новый снапшот (вдруг починили?), а потом откатиться на 3.0 (вдруг проблема не во мне?)
источник