Size: a a a

2018 November 07

DG

Denis Goa in Moscow Spark
Fedor Lavrentyev
Я не осилил ваш пост.
Где тут вопрос? Каких ответов вы ожидаете? О каком вообще инструменте речь?
Хотелось бы узнать мнение сообщества по следующим моментам:

1) на сколько эти инструменты актуальны ( DRUID over SPARK либо KYRLIN & Spark) в качестве альтернативы проприетарных СУРБД и систем BI (оракл + таблё)? На лицензии и железо понятных и близких мне SQL Server SSAS нет бюджета. Да и имеющееся железо с оракл  уже который год тонет в болоте хаоса в отсутствие хозяина.
источник

DG

Denis Goa in Moscow Spark
2) безлицензии используемая пока Devs версия SSAS для тестовых разработок OLAP превращается тупую пробку  когда читает данные из Oracle (10 тыс записей в 20 сек). И очень не хочется ожидать завершения процессинга 5-9 часов. Хотелось бы скорости по 30-50 млн строк в сек средствами SPARK / HIVE и просто собирать это на ещё более шустром OLAP движке DRUID
источник

DG

Denis Goa in Moscow Spark
Кто пробовал ? Возможно ли это ?
источник

FL

Fedor Lavrentyev in Moscow Spark
Denis Goa
Хотелось бы узнать мнение сообщества по следующим моментам:

1) на сколько эти инструменты актуальны ( DRUID over SPARK либо KYRLIN & Spark) в качестве альтернативы проприетарных СУРБД и систем BI (оракл + таблё)? На лицензии и железо понятных и близких мне SQL Server SSAS нет бюджета. Да и имеющееся железо с оракл  уже который год тонет в болоте хаоса в отсутствие хозяина.
Druid это узкое нишевое решение, рассматривать его как альтернативу generic BI я бы не стал.

Spark STS + HDFS + Tableau (или Superset) - вполне себе жизнеспособный стек для BI, который начинает обгонять Oracle по производительности (и удельной стоимости) на датасетах хотя бы в 100 ГБ, а лучше в 1 ТБ.

Процессить 30-50 млн строк в секунду средствами Х возможно, но для этого нужны довольно большие мощности.
источник

DG

Denis Goa in Moscow Spark
источник

DG

Denis Goa in Moscow Spark
Спасибо Федор за очень четкое заключение!

Сейчас есть что покопать в ближайшие дни
источник

АЖ

Андрей Жуков... in Moscow Spark
Fedor Lavrentyev
Druid это узкое нишевое решение, рассматривать его как альтернативу generic BI я бы не стал.

Spark STS + HDFS + Tableau (или Superset) - вполне себе жизнеспособный стек для BI, который начинает обгонять Oracle по производительности (и удельной стоимости) на датасетах хотя бы в 100 ГБ, а лучше в 1 ТБ.

Процессить 30-50 млн строк в секунду средствами Х возможно, но для этого нужны довольно большие мощности.
О,  а у тебя есть юзкейс Табло с хадупом?
источник

DG

Denis Goa in Moscow Spark
Fedor Lavrentyev
Druid это узкое нишевое решение, рассматривать его как альтернативу generic BI я бы не стал.

Spark STS + HDFS + Tableau (или Superset) - вполне себе жизнеспособный стек для BI, который начинает обгонять Oracle по производительности (и удельной стоимости) на датасетах хотя бы в 100 ГБ, а лучше в 1 ТБ.

Процессить 30-50 млн строк в секунду средствами Х возможно, но для этого нужны довольно большие мощности.
А может эту тему на доклад ? 😇
источник

FL

Fedor Lavrentyev in Moscow Spark
Андрей Жуков
О,  а у тебя есть юзкейс Табло с хадупом?
Ага, зробит.
источник

DG

Denis Goa in Moscow Spark
Работающий ?
источник

АЖ

Андрей Жуков... in Moscow Spark
Fedor Lavrentyev
Ага, зробит.
А то у нас архи за вертику топят
источник

FL

Fedor Lavrentyev in Moscow Spark
Denis Goa
А может эту тему на доклад ? 😇
Это очень общая тема, о ней только с броневика вещать. =)
источник

PK

Pavel Klemenkov in Moscow Spark
Андрей Жуков
А то у нас архи за вертику топят
А S7 бохатая компания я посмотрю ))
источник

FL

Fedor Lavrentyev in Moscow Spark
Андрей Жуков
А то у нас архи за вертику топят
Ну, вертика круче хадупа, тут не о чем спорить. =)
Пока есть золото, для работы со структурирванными данными к хадупу лучше не прикасаться =)
источник

АЖ

Андрей Жуков... in Moscow Spark
Pavel Klemenkov
А S7 бохатая компания я посмотрю ))
Ах,  если бы :)  микрокластеры плодят
источник

DG

Denis Goa in Moscow Spark
но надо , Федор.

Обещаю я буду самым внимательным слушателем и приведу ещё трёх Акуратных студентов
источник

АЖ

Андрей Жуков... in Moscow Spark
Надо затестить Табло с хадупом
источник

FL

Fedor Lavrentyev in Moscow Spark
Со спарком, Андрюх.
источник

FL

Fedor Lavrentyev in Moscow Spark
STS + Tableau
источник

АЖ

Андрей Жуков... in Moscow Spark
Ясен пень на спарке
источник