Друзья мои, мы, потихонечку, начинаем готовить Moscow Spark #6. Состоится он, видимо, во второй половине ноября. Когда пройдет, по крайней мере, Highload++. Если у кого-то есть материал, чтобы сделать клевый доклад, жду вас в личку )
Всем привет, кто-то сталкивался с проблемой в спарке - push down predicate(PDP) не работает если таблица была создана Импалой. Если таблицу создать Спарком или читать паркет файлы напрямую типа spark.read.load.filter то все работает.
Всем привет, кто-то сталкивался с проблемой в спарке - push down predicate(PDP) не работает если таблица была создана Импалой. Если таблицу создать Спарком или читать паркет файлы напрямую типа spark.read.load.filter то все работает.
Тут проблема с метаданными, тк если я добавлю в Импала таблицу свойства (TBLPRPOPERTIES spark.sql.source.provider=parquet ... И еще и схему) то тогда когда я буду читать спарком он будет знать метаданные и б
Расскажите, есть ли опыт использования инструментов Data Quality. Типа SAS DQ, IBM Data Quality Server, Informatica DQ, Collibra, Ataccama Буду признателен за отзывыв, особенно по двум последним