Size: a a a

R (язык программирования)

2020 October 27

JS

Jury Sergeev in R (язык программирования)
Philipp Upravitelev
у меня в одной из работ была специфичная логика - мы clickhouse использовали как хранилище данных, куда заливали уже собранные и почищенные данные от пользователей
в первую очередь потому что постгря не справлялась с такими объемами (по словам нашего дба, как там реально было - я хз)
да, это для кликхаус самое оно
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
у меня в одной из работ была специфичная логика - мы clickhouse использовали как хранилище данных, куда заливали уже собранные и почищенные данные от пользователей
в первую очередь потому что постгря не справлялась с такими объемами (по словам нашего дба, как там реально было - я хз)
У нас также
источник

ДВ

Дмитрий Володин... in R (язык программирования)
КХ очень радует. Особенно тем, что работа там похожа на работу с таблицами в R. Стандартный подход из реляционных СУБД не очень-то работает (стоит сразу забыть про многократные джойны, а оконных функций так вообще нет). Переезжать с SQL сервера было сначала непривычно, а теперь даже не знаю, смогу ли не плеваться, если придётся снова в tsql писать. Настолько удобно и шустро.
источник

AS

Alexander Semenov in R (язык программирования)
А потом запускаешь на этом хозяйстве Графану и ждёшь по несколько минут график.
источник

AS

Alexander Semenov in R (язык программирования)
Дмитрий Володин
КХ очень радует. Особенно тем, что работа там похожа на работу с таблицами в R. Стандартный подход из реляционных СУБД не очень-то работает (стоит сразу забыть про многократные джойны, а оконных функций так вообще нет). Переезжать с SQL сервера было сначала непривычно, а теперь даже не знаю, смогу ли не плеваться, если придётся снова в tsql писать. Настолько удобно и шустро.
А как же без оконных функций? В R/Python считать?
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Alexander Semenov
А как же без оконных функций? В R/Python считать?
Массивы спасают, если надо что-то сложное посчитать. А так встроенных агрегатных функций вполне хватает. argMin, argMax например.
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
А как же без оконных функций? В R/Python считать?
к слову, я не могу сказать, что мне как-то очень часто нужны оконные функции
источник

АК

Артём Клевцов... in R (язык программирования)
Alexander Semenov
А потом запускаешь на этом хозяйстве Графану и ждёшь по несколько минут график.
Это на КХ? Я думал, оно как раз заточен на то, чтобы быстро фильтровать и агрегировать, что для дашбордов самое оно.
источник

PU

Philipp Upravitelev in R (язык программирования)
Артём Клевцов
Это на КХ? Я думал, оно как раз заточен на то, чтобы быстро фильтровать и агрегировать, что для дашбордов самое оно.
смотря сколько данных, все равно
у меня бывали запросы, которые по несколько минут работали, в терминальных случаях до часа-двух доходило
но там и агрегаты, и джойны, и фильтрация по json-строке, и импорт в R были
источник

JS

Jury Sergeev in R (язык программирования)
Артём Клевцов
Это на КХ? Я думал, оно как раз заточен на то, чтобы быстро фильтровать и агрегировать, что для дашбордов самое оно.
все так, если минуты данные отдает - то все плохо с настройками, схемами таблиц и партиционирования или запросами...
источник

JS

Jury Sergeev in R (язык программирования)
Philipp Upravitelev
смотря сколько данных, все равно
у меня бывали запросы, которые по несколько минут работали, в терминальных случаях до часа-двух доходило
но там и агрегаты, и джойны, и фильтрация по json-строке, и импорт в R были
в КХ есть многое, что бы эти вещи делать в потоке, а забирать уже готовое из материализованных представлений, например... в общем, оптимизация все равно нужна
источник

JS

Jury Sergeev in R (язык программирования)
в общем, как обычно, нет серебряной пули )
источник

PU

Philipp Upravitelev in R (язык программирования)
всегда нужна, что поделать
фраки это все, про серебряную пулю %)))
источник

PU

Philipp Upravitelev in R (язык программирования)
Jury Sergeev
в КХ есть многое, что бы эти вещи делать в потоке, а забирать уже готовое из материализованных представлений, например... в общем, оптимизация все равно нужна
это был разовый запрос на выгрузку данных, не для борды, естественно. делать под него инфраструктуру в виде агрегатов и вьюх - слишком дорого по времени, имхо
источник

JS

Jury Sergeev in R (язык программирования)
Philipp Upravitelev
это был разовый запрос на выгрузку данных, не для борды, естественно. делать под него инфраструктуру в виде агрегатов и вьюх - слишком дорого по времени, имхо
согласен, просто за КХ впрягся ))
источник

JS

Jury Sergeev in R (язык программирования)
он реально дико быстр
источник

PU

Philipp Upravitelev in R (язык программирования)
это я знаю, с этим спора нет :)))
источник

АК

Артём Клевцов... in R (язык программирования)
Кейс такой. Строк где-то 5-10 млн строк. Есть 3-5 столбцов для фильтрации с текстовыми значениями (или UUID) и датой. Задача слепить данные для дашборда: фильтрация + агрегация.
Сейчас использует постгря с партиционированием и колоночным хранилищем для самой здоровой партиции. Запросы отадёт за 3-5 секунд.
источник

PU

Philipp Upravitelev in R (язык программирования)
если у тебя сервер с bi не там же, где и бд, у тебя на пересылку данных много времени уходить будет
источник

PU

Philipp Upravitelev in R (язык программирования)
если ты спрашиваешь про оптимизацию - делай промежуточные агрегаты для дашбордов
источник