Size: a a a

R (язык программирования)

2021 May 07

AS

Alexander Semenov in R (язык программирования)
Мне вот то же самое говорят
источник

IS

Ilya Shutov in R (язык программирования)
в общем, было бы желание, а где руки приложить — найдется.
источник

AS

Alexander Semenov in R (язык программирования)
Подобную дискуссию лучше проводить в каком-нибудь баре под пиво или лучше водку. Чтобы можно было бить кулаком себя в грудь и по столу.
источник

IS

Ilya Shutov in R (язык программирования)
кстати, поглядите фильмик:
https://www.rstudio.com/resources/rstudioconf-2017/happy-r-users-purrr-tutorial-/

на rconf вообще ОЧЕНЬ МНОГО показывают и рассказывают ценных вещей
источник

AS

Alexander Semenov in R (язык программирования)
Я регулярно их доклады поглядываю.
источник

IS

Ivan Struzhkov in R (язык программирования)
ну из моей практики пример- парсинг чего то слабоструктурированого, с постраничным опросом.

Поэлементное обращение к апи,
Быстрый опрос нескольких бд
источник

AS

Alexander Semenov in R (язык программирования)
Вот последний пункт в сердечке откликнулся.
источник

IS

Ivan Struzhkov in R (язык программирования)
ну до базы с транзакциями дойти обычно не проблема. Оттуда выручка достается
источник

IS

Ivan Struzhkov in R (язык программирования)
еще вспомнил парсинг сложных json ов, когда силами бд не победить, да и просто длинных текстов
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Ага, а потом начинается: "это не те транзакции, это мы вообще не считаем, это другой юнит, это транзакция внутри холдинга". И вот эти "это" часто только в голове заказчика)
источник

IS

Ilya Shutov in R (язык программирования)
Поэлементное обращение к апи — тут неплохо бы уточнить, может оно и не нужно поэлементное....
но в этом случае очень хорошо использовать https://github.com/HenrikBengtsson/doFuture
plan(future.callr::callr)
обычно API отвечает долго. можно создать воркеров много больше (32-64, сколько ОС позволит) чем ядер (они все равно будут 95% времени простаивать) и дать нагрузку на API по полной.
если API не помрет, то данные можно вытащить на максимальной скорости.
а разработчики будут вспоминать вас хорошими словами.

на практике такой стресс-тест мало какая система проходит. а все потому, что API пишут по остаточному принципу.
источник

AS

Alexander Semenov in R (язык программирования)
Т.е. если у меня есть 8 идентичных баз (1 на МРФ), к которым мне нужно сделать идентичный запрос. Где мне тут этот ваш параллелизм поможет?
источник

IS

Ilya Shutov in R (язык программирования)
одновременно их запустить
furrr/foreach
ускорение почти в 8 раз.
главное, чтобы оперативки и ядер хватило.

Что не так?
источник

IS

Ilya Shutov in R (язык программирования)
чем парсите?
источник

AS

Alexander Semenov in R (язык программирования)
Ок, гляну, как это написано на другом языке. Если реально в 8 раз, то ради того, чтобы лишний раз адептов того языка ткнуть носом вот в это самое, я готов и виньетки почитать.
источник

IS

Ilya Shutov in R (язык программирования)
тут не все так однозначно, надо глядеть на код и доступные ресурсы машины.
но это вот просто азбучный базовый кейс, когда ускоряем работу с базой.
даже с одной единственной. просто запросы по партициям разбиваем. с большой вероятностью они будут лежать на разных шардах. можно ключ CREATE TABLE поглядеть.
источник

IS

Ilya Shutov in R (язык программирования)
а что, в ОПСОС-ах еще осталось кого тыкать?
источник

DK

Dm Kb in R (язык программирования)
Вполне успешно можно дербанить JSON с помощью jsonlite, purrr и tydir
источник

IS

Ilya Shutov in R (язык программирования)
какой объем?
источник

IS

Ivan Struzhkov in R (язык программирования)
ну там fromjson и всякое такое, если про тексты то стрингером
источник