Телеграмм чат группы moscowspark страница 497

ох.. по моему его нет в списке . что то специальное под заказчика
Apache Spark - 10 домашек

тут только 5
https://newprolab.com/ru/spark-module

а все как в анекдоте

- вот бумага , вот ручка . ручкой можно рисовать.
- а теперь - портрет преподавателя 😂

источник

01:01пожаловаться #3

AA

Aleksandr Aleksandro... in Moscow Spark

er@essbase.ru

метод append - я видел ) 😉
но тест результатов с эталоном на учебном курсе не проходит 😞

заставляют сделать свой велосипед. 😱

Никто свой велосипед там делать не заставляет. Сам прошел этот курс недавно. Все решается стандартными методами, надо просто лучше смотреть документацию

источник

03:02пожаловаться #4

e

er@essbase.ru in Moscow Spark

Вау вау, полеХШе ) я правильно понимаю , что после прохождения этого курса, буду так же в дверной проем не проходить ?😂

источник

08:00пожаловаться #5

e

er@essbase.ru in Moscow Spark

У меня предметная область такая , что появление новых колонок это норма, примерно раз в месяц будет появляться новые показатели. И пока моей фантазии хватило только на то , что бы найти способ хранить массив в ячейке. Конечно есть ещё путь , когда индикаторы переносятся в строчки и в звезде только одно поле для значений.

Но это не Hadoop way 😂 теряется все преимущество поколоночного хранения индикаторов.

В общем вопрос такой , как лучше обновлять старые паркетники на предмет изменения состава колонок.

Есть ли стандартный способ хранения и соответствующие библиотеки , для обработки метаданных в таком изменчивом мире ?)

источник

09:25пожаловаться #6

ПФ

Паша Финкельштейн... in Moscow Spark

er@essbase.ru

У меня предметная область такая , что появление новых колонок это норма, примерно раз в месяц будет появляться новые показатели. И пока моей фантазии хватило только на то , что бы найти способ хранить массив в ячейке. Конечно есть ещё путь , когда индикаторы переносятся в строчки и в звезде только одно поле для значений.

Но это не Hadoop way 😂 теряется все преимущество поколоночного хранения индикаторов.

В общем вопрос такой , как лучше обновлять старые паркетники на предмет изменения состава колонок.

Есть ли стандартный способ хранения и соответствующие библиотеки , для обработки метаданных в таком изменчивом мире ?)

Методом перезаписывания, мне кажется. К счастью если работать с хайвом - то схема между партициями может отличаться, например. Тогда пока старое не пересчиталось - там будут null'ы приходить

источник

09:40пожаловаться #7

e

er@essbase.ru in Moscow Spark

Паша Финкельштейн

Методом перезаписывания, мне кажется. К счастью если работать с хайвом - то схема между партициями может отличаться, например. Тогда пока старое не пересчиталось - там будут null'ы приходить

👍 hive да ) звучит то что нужно ) Спасибо !)

источник

09:43пожаловаться #8

ПФ

Паша Финкельштейн... in Moscow Spark

er@essbase.ru

👍 hive да ) звучит то что нужно ) Спасибо !)

Я не уверен что в этой картинке мне правда нужен хайв. Вероятно Спарк метастор делает ровно так же

источник

09:45пожаловаться #9

ПФ

Паша Финкельштейн... in Moscow Spark