Size: a a a

2018 November 07

DG

Denis Goa in Moscow Spark
Т.е. хочется многомерку
источник

DG

Denis Goa in Moscow Spark
С MDX как с вишенкой поверх всего
источник

PK

Pavel Klemenkov in Moscow Spark
Почему не кликхаус?
источник

DG

Denis Goa in Moscow Spark
Аналог который есть этопроприетарный AtScale.com
источник

DG

Denis Goa in Moscow Spark
Pavel Klemenkov
Почему не кликхаус?
Не могу ответить, пока  ещё не знаком с этим продуктом
источник

DG

Denis Goa in Moscow Spark
Хм, интересно , посмотрю , Яндекс 😃
источник

PK

Pavel Klemenkov in Moscow Spark
Если что, первый юзкейс кликхауса - это отчеты в яндекс-метрике по произвольным срезам. Т.е. олап их уже не устраивал. Ну а теперь внедрений тысячи.
источник

DG

Denis Goa in Moscow Spark
😱
источник

DG

Denis Goa in Moscow Spark
Оболдеть
источник

DG

Denis Goa in Moscow Spark
Смотрю
источник

FL

Fedor Lavrentyev in Moscow Spark
Pavel Klemenkov
Если что, первый юзкейс кликхауса - это отчеты в яндекс-метрике по произвольным срезам. Т.е. олап их уже не устраивал. Ну а теперь внедрений тысячи.
Не совсем по произвольным, скорее, по обильно проиндексированным. Это во-первых.
А во-вторых, по одной плоской факт-таблице с маленькими таблицами измерений. Это допущение они обошли пока не полностью.

Это делает ClickHouse непригодным для полноценного generic BI, пока они не запилят нормальный distributed join.
источник

DM

Den Mak in Moscow Spark
Вооо, становится понятнее,  т.е. все же имеется в виду движок мультидименшн поверх спарка...
источник

DM

Den Mak in Moscow Spark
Не тривиальная задача
источник

DM

Den Mak in Moscow Spark
Насколько я знаю более менее Apache Kylin более или менее приблизился к такой реализации на базе хадупа
источник
2018 November 08

TB

Torlin Bios in Moscow Spark
Год назад кайлин пробовали юзать и сравнивали со связкой hive+tez+llap, используя тестовые квери. Не знаю как сейчас, но тогда на спарке не было возможности запустить, только на мапредьюсе, потом забросили эту идею, так как все таки был сыроват
источник

FL

Fedor Lavrentyev in Moscow Spark
Мы пробовали подключать Tableau и к Spark, и к Hive on Tez + LLAP. Последний, на глазок, медленнее более чем в два раза.

Допускаю, что это потому, что мы не умеем его готовить.
источник
2018 November 12

PK

Pavel Klemenkov in Moscow Spark
Всем привет!. Есть вопрос со спарковским csv ридером. Есть csv, у него есть столбец с тексами. Тексты многострочные, в них сожержатся виндовые переносы. Тексты заключены в двойные кавычки. Выставление опции multiLine вообще не помогает. В чем может быть трабл, как помочь?
источник

PK

Pavel Klemenkov in Moscow Spark
Пандасик, при этом, отлично прожевывает файлик
источник

GP

Grigory Pomadchin in Moscow Spark
Pavel Klemenkov
Всем привет!. Есть вопрос со спарковским csv ридером. Есть csv, у него есть столбец с тексами. Тексты многострочные, в них сожержатся виндовые переносы. Тексты заключены в двойные кавычки. Выставление опции multiLine вообще не помогает. В чем может быть трабл, как помочь?
попробуй анкодинг утф8 указать файла и мултилайн анкодинг
источник

GP

Grigory Pomadchin in Moscow Spark
но оно может тоже не работать; там помоему был какойто баг что спарк не работал с анкодинг + мултилайн
источник