Size: a a a

2021 May 04

t

tenKe in Moscow Spark
Это не баг, это фича
источник

t

tenKe in Moscow Spark
источник

t

tenKe in Moscow Spark
там все еще веселее
источник

GP

Grigory Pomadchin in Moscow Spark
апи ниоч прост над переделывать
источник

t

tenKe in Moscow Spark
Есть две версии Datasource API
источник

t

tenKe in Moscow Spark
В первой (которая еще со времен первого спарка тянется) нет возможности УБРАТЬ фильтр из плана - то есть его можно запушдаунить, но в плане он как был, так и останется
источник

t

tenKe in Moscow Spark
Во второй, на которую уже начали переползать, фильтр убрать можно
источник

t

tenKe in Moscow Spark
видимо это делали из расчета, что если в коннекторе кривой код и он криво пушдауны обрабатывает, то спарк все равно затащит и все зафильтрует
источник

t

tenKe in Moscow Spark
источник

t

tenKe in Moscow Spark
Я вот другого не совсем понимаю - как работает wholestagecodegen, когда в нем чтение какого нибудь датасурса
источник

GP

Grigory Pomadchin in Moscow Spark
я думаю ооп корни и избыточный функционал
источник

GP

Grigory Pomadchin in Moscow Spark
думали ок оказалось гавно
источник

GP

Grigory Pomadchin in Moscow Spark
надо выкидывать старое апи думаю
источник

t

tenKe in Moscow Spark
То есть если, например, читануть ластик и сделать .count, то первый HashAggregate будет в WSCG с оператором чтения этого ластика
источник

t

tenKe in Moscow Spark
но есть влажный момент
источник

t

tenKe in Moscow Spark
Чтение ластика никакого отношения к кодогенерации не имеет)
источник

GP

Grigory Pomadchin in Moscow Spark
Лол
источник

GP

Grigory Pomadchin in Moscow Spark
интересно что будет в спарк 4
источник

t

tenKe in Moscow Spark
я так по ошибке сначала думал, что все файл формат ридеры - это кодогенерация
источник

PK

Pavel Klemenkov in Moscow Spark
Он умрет и останется только флинк))
источник