Size: a a a

R (язык программирования)

2020 July 27

A

Andrey in R (язык программирования)
Jury Sergeev
т.е. пишете свой PipeOp (расширяя подходящий базовый класс) - а он пусть вызывает Ваши скрипты и логирует в какую-то базу данных - профит
пайпы в mlr3 все же немного для другого, а вот drake - точно то, что нужно
источник

A

Andrey in R (язык программирования)
https://books.ropensci.org/drake/index.html#short-version целая книжка про него
источник

JS

Jury Sergeev in R (язык программирования)
о, благодарю
источник

JS

Jury Sergeev in R (язык программирования)
согласен, drake самое оно
источник

ЕБ

Евгений Балакловский... in R (язык программирования)
Артём Клевцов
Опиши конкретный кейс и что требуется, а то абстрактный вброс получишь только абстрактные отписки. Если хочется питон, то не стоит искать лишний повод.
не хочется питон, я верю в Р)

- Из источников есть 3 разных бд, данные социальных сетей, CRM
- Из задач есть BI, типа надо делать отчетность для табло. Есть лайтовые задачи с банальными агрегациями, достаточно вьюх навертеть и скормить табло, бывают чуть масштбанее, типа посчитать кучу всего по 100 метрикам (значимости, дисперсии, графики и т.п)
- Еще есть задачи с банальным перекладыванием одних данных из одной таблички одной бд в другую бд по расписанию и там еще тоже какую то агрегацию применить
- Ну и есть задачки типа стучаться к API фейсбука и рекламные расходы забирать, их обрабатывать, складировать в одну базу одну, в другую другое

Оркестрация да, тут оч оч нужна(
источник

JS

Jury Sergeev in R (язык программирования)
Евгений Томилов
А возможно, вообще, на R написать API, которое будет принимать на вход датасет, предобрабатывать его, применять к нему заранее настроенную модель и выдавать ответ в json или ином формате? И всё это так, чтобы я мог просто дать образ любому админу, и тот его задеплоил себе на сервер и подвязал вывод API к рисовальщику диаграмм, например.

Я такое уже делал примерно, но там был один поток и я с помощью Артёма демоном просто клал на сервер.
mlr3 + plumber и в docker
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Jury Sergeev
mlr3 + plumber и в docker
Ага, хм. Посмотрю эту связку.
источник

JS

Jury Sergeev in R (язык программирования)
Евгений Балакловский
не хочется питон, я верю в Р)

- Из источников есть 3 разных бд, данные социальных сетей, CRM
- Из задач есть BI, типа надо делать отчетность для табло. Есть лайтовые задачи с банальными агрегациями, достаточно вьюх навертеть и скормить табло, бывают чуть масштбанее, типа посчитать кучу всего по 100 метрикам (значимости, дисперсии, графики и т.п)
- Еще есть задачи с банальным перекладыванием одних данных из одной таблички одной бд в другую бд по расписанию и там еще тоже какую то агрегацию применить
- Ну и есть задачки типа стучаться к API фейсбука и рекламные расходы забирать, их обрабатывать, складировать в одну базу одну, в другую другое

Оркестрация да, тут оч оч нужна(
ну вариантов масса, уже озвучили несколько
источник

JS

Jury Sergeev in R (язык программирования)
атомарные (с точки зрения пользы от работы) скрипты на R, а их уже дергать или R/drake или системами ETL
источник

АК

Артём Клевцов... in R (язык программирования)
Jury Sergeev
атомарные (с точки зрения пользы от работы) скрипты на R, а их уже дергать или R/drake или системами ETL
Или кучка микросервисов и сервер очередей.
источник

JS

Jury Sergeev in R (язык программирования)
Артём Клевцов
Или кучка микросервисов и сервер очередей.
да, или так... сильно зависит от... )
источник

JS

Jury Sergeev in R (язык программирования)
в этом плане R вообще восхищает - там все есть, можно построить оч. быстро решение, а на тяжелые штуки переходить если нагрузка ну прямо настоящий highload
источник

АК

Артём Клевцов... in R (язык программирования)
С логами в R тоже все хорошо. Хоть в файлы, хоть в бд писать можно. Потом их мониторить и анализировать.
источник

JS

Jury Sergeev in R (язык программирования)
в R только с нейронками похуже чем в питоне, а так - я пока не нашел для себя доводов на питон переходить... это если только будущий работы-датель заставит...
источник

AS

Anton Silchenko in R (язык программирования)
Коллеги, помогите пожалуйста. Есть два дата фрейма df1 и df2.  Необходимо из каждой строки df1 взять комбинацию значений определенных столбов, пускай это будет df1$а1 и df1$а2, найти соответствующую комбинацию в df2, пускай это будут df2$a1 и df2$a2, и вернуть в df1  значение df2$a3 из строки в которой было найдено совпадение с условием.  Можно это через джоин провернуть, но получается хтоническое чудовище. \
источник

JS

Jury Sergeev in R (язык программирования)
Anton Silchenko
Коллеги, помогите пожалуйста. Есть два дата фрейма df1 и df2.  Необходимо из каждой строки df1 взять комбинацию значений определенных столбов, пускай это будет df1$а1 и df1$а2, найти соответствующую комбинацию в df2, пускай это будут df2$a1 и df2$a2, и вернуть в df1  значение df2$a3 из строки в которой было найдено совпадение с условием.  Можно это через джоин провернуть, но получается хтоническое чудовище. \
кусочек данных в .RDS или .csv - исходник - и желаемый результат - даст прирост вероятности помощи )
источник

AS

Anton Silchenko in R (язык программирования)
Jury Sergeev
кусочек данных в .RDS или .csv - исходник - и желаемый результат - даст прирост вероятности помощи )
Я работаю с персональными данными, как минимум - так плохо делать, с такой инфой))
источник

JS

Jury Sergeev in R (язык программирования)
Anton Silchenko
Я работаю с персональными данными, как минимум - так плохо делать, с такой инфой))
ну исскуственные то - на 5ть строчек сделать можно )
источник

JS

Jury Sergeev in R (язык программирования)
а иначе - как помочь?
источник

PU

Philipp Upravitelev in R (язык программирования)
я, например, из описания плохо понял, в чем проблема
источник