Size: a a a

2018 November 01

SK

Sergey Karpiy in Moscow Spark
Я надеялся что автоматом сработает map join
источник

SK

Sergey Karpiy in Moscow Spark
По идее если обе таблицы идут в кеш, то делается броадкаст, а потом фильтр
источник

SK

Sergey Karpiy in Moscow Spark
Но что то не так пока
источник

PK

Pavel Klemenkov in Moscow Spark
Что за курс, подкинь?
источник

PK

Pavel Klemenkov in Moscow Spark
О, я его даже смотрел же. Но забыл (
источник

SK

Sergey Karpiy in Moscow Spark
В итоге все заработало из коробки, помог промежуточный персист, сразу после джоина
источник
2018 November 02

PK

Pavel Klemenkov in Moscow Spark
Эй, ребятка и девчатки. Всем привет! Меня немного (а точнее много) печалит ситуация с откликами на call for talk для очередного митапа. Пока желающих выступать не нашлось от слова совсем. Поэтому обращаюсь к аудитории еще разок: есть ли у кого-то интересные темы и достижения, которыми вы готовы поделиться?
источник

S

Stanislav in Moscow Spark
Горячая пора сдачи проектов :)
источник

AU

Andrey Uvarov in Moscow Spark
А когда митап
источник

AU

Andrey Uvarov in Moscow Spark
?
источник

PK

Pavel Klemenkov in Moscow Spark
Andrey Uvarov
А когда митап
Когда докладчиков наберём)
источник

AU

Andrey Uvarov in Moscow Spark
Pavel Klemenkov
Когда докладчиков наберём)
А примерно? От этого зависит сможем или нет доклад сделать)
источник

PK

Pavel Klemenkov in Moscow Spark
Конец ноября - начало декабря
источник

N

Ninja in Moscow Spark
Привет! Скиньте пожалуйста хорошую ссылку, где можно почитать про партицированные таблички в hive и работу с ними спарком
источник

PK

Pavel Klemenkov in Moscow Spark
Ninja
Привет! Скиньте пожалуйста хорошую ссылку, где можно почитать про партицированные таблички в hive и работу с ними спарком
А в чем вопрос-то? Вангую, что проблема с динамическим партиционированием.
источник

N

Ninja in Moscow Spark
Проблема с тем, шо я эт первый раз делаю. Мне кое что объяснили, но хочу почитать еще, поразбираться все такое прочее
источник

N

Ninja in Moscow Spark
В шею не гонят, есть время посидеть
источник

PK

Pavel Klemenkov in Moscow Spark
Так а в чем разбираться-то? Про партиционирование в Hive написано в доке на офф сайте https://cwiki.apache.org/confluence/display/Hive/Tutorial
источник

PK

Pavel Klemenkov in Moscow Spark
Spark SQL может читать их хайва из партиционированных таблиц и может писать в хайв в партиционированные таблицы. Основная загвоздка вот https://medium.com/@anuvrat/writing-into-dynamic-partitions-using-spark-2e2b818a007a
источник

ЕГ

Евгений Глотов... in Moscow Spark
Да, инсёрт оверврайт - это опасно)
источник