Size: a a a

2020 October 30

M

Mi in Moscow Spark
может поможет
источник

M

Mi in Moscow Spark
ну, по крайней мере не 0 должен возвращаться
источник

JF

Jane Frankenstein in Moscow Spark
спасибо за вариант
источник

JF

Jane Frankenstein in Moscow Spark
да
источник

ИГ

Игорь Гомановский... in Moscow Spark
Jane Frankenstein
замена значений и фильтрация
Попробуйте явно указать спарку о том, что в последнем Stage не нужно перечитывать весь набор данных: df.select(lit(1)).rdd...
источник

AS

Andrey Smirnov in Moscow Spark
Jane Frankenstein
замена значений и фильтрация
так а что шафл вызывает, как уже сказали  count этого не делает сам по себе
источник

JF

Jane Frankenstein in Moscow Spark
Andrey Smirnov
так а что шафл вызывает, как уже сказали  count этого не делает сам по себе
17:10:54 ERROR ShuffleBlockFetcherIterator: Failed to get block(s)
источник

JF

Jane Frankenstein in Moscow Spark
к примеру
источник

AS

Andrey Smirnov in Moscow Spark
еще раз, то что вы описываете, чтение, замена и фильтрация не должны вызывать шаффл
источник

JF

Jane Frankenstein in Moscow Spark
ааа
источник

JF

Jane Frankenstein in Moscow Spark
нет, я не говорю, что они вызывают
источник

JF

Jane Frankenstein in Moscow Spark
count вызывает
источник

JF

Jane Frankenstein in Moscow Spark
по стэктрейсу видно
источник

JF

Jane Frankenstein in Moscow Spark
и в AM  Yarn
источник

JF

Jane Frankenstein in Moscow Spark
смотрю по таске, что у нее фейл, смотрю почему
источник

AS

Andrey Smirnov in Moscow Spark
и count не должен, он может форсить его из-за того, что у вас где-то есть агрегация, join, и т.д., как выгялдит план выполнения?
источник

AS

Andrey Smirnov in Moscow Spark
в spark ui смотрите
источник

JF

Jane Frankenstein in Moscow Spark
я знаю где
источник

JF

Jane Frankenstein in Moscow Spark
просто не хочу выкладывать в общий доступ
источник

JF

Jane Frankenstein in Moscow Spark
а подскажите, пожалуйста, на что обратить внимание?
источник