Телеграмм чат группы rlang

Это проф. деформация из-за необходимости писать код для прода, где всё должно летать и не есть лишнюю память.
Использование мета-пакетов, которые подгружают кучу других пакетов, приводит к снижению уровня контроля над кодом, что в свою очередь затруднит его дальнейшую отладку и сделает сам код более подверженным ошибкам в силу увеличения количества зависимостей, в каждой из которых могут содержаться свои ошибки.

источник

19:05пожаловаться #4

ЕТ

Евгений Томилов... in R (язык программирования)

Артём Клевцов

А где пишут в прод на R? Мне приходится всё на Питон потом переписывать.

источник

19:11пожаловаться #5

АК

Артём Клевцов... in R (язык программирования)

Евгений Томилов

А где пишут в прод на R? Мне приходится всё на Питон потом переписывать.

Там, куда я прихожу 😁

источник

19:12пожаловаться #6

АК

Артём Клевцов... in R (язык программирования)

Хотя, бывали случае, когда на R писали и до моего прихода.

источник

19:13пожаловаться #7

Ivan Struzhkov in R (язык программирования)

Артём Клевцов

Там, куда я прихожу 😁

Мощь. Если есть что почитать как настроено и как организовано житие в продакшене было бы круто

источник

19:13пожаловаться #8

АК

Артём Клевцов... in R (язык программирования)

Это отчасти следствие того, что там где мне приходилось работать, не было сформированной команды сатанистов/аналитиков/разрабов со своей экосистемой и жёсткими конвенциями.

источник

19:15пожаловаться #9

Stan in R (язык программирования)

Евгений Томилов

А где пишут в прод на R? Мне приходится всё на Питон потом переписывать.

В университетах точно

источник

19:17пожаловаться #10

aGricolaMZ in R (язык программирования)

В университете прод?

Я не понимаю этого слова?

источник

19:46пожаловаться #11

ЕТ

Евгений Томилов... in R (язык программирования)

aGricolaMZ

В университете прод?

Я не понимаю этого слова?

*выпускает диплом в продакшн, в самый последний момент переделывая UI*

источник

19:48пожаловаться #12

Jury Sergeev in R (язык программирования)

да на самом деле, что не так то? ну R в проде и что? я лично не вижу каких-то реальных проблем от его использования в проде...

источник

19:53пожаловаться #13

Jury Sergeev in R (язык программирования)

много работаю с данными, ну не больно это, возможно, потому что данные далеко не Big

источник

19:53пожаловаться #14

ЕТ

Евгений Томилов... in R (язык программирования)

Jury Sergeev

много работаю с данными, ну не больно это, возможно, потому что данные далеко не Big

Да и если биг, то всегда есть rspark какой-нибудь.

источник

19:54пожаловаться #15

Jury Sergeev in R (язык программирования)

просто все по месту хорошо, где надо - RDBMS, где-то Clickhouse, и Kafka есть, а где то Redis... у нас много где R, потому что time-to-market малый достаточно

источник

19:54пожаловаться #16

Jury Sergeev in R (язык программирования)

дело-то не в языке и его годности-негодности - просто питонистов много, и они дешевле от этого

источник

19:55пожаловаться #17

Jury Sergeev in R (язык программирования)

на долгих зубодробительных вещах у нас Pentaho DI, но все чаще в нем же вызывается R, для получения данных из API, и преобразования сложно-вложенных json-ответов в табличный вид, очень удобно

источник

19:56пожаловаться #18

Jury Sergeev in R (язык программирования)

вот с drake сдружился, можно и без пентахи обойтись )

источник

19:58пожаловаться #19

Anton I in R (язык программирования)

Janzeero

Здравствуйте. Я построил пару линейных моделей, где целевой переменной является количество пикселей целевого класса наземного покрова, вычисленных для каждого геопространственного полигона (т.е. образцы в тренировочном наборе) разной площади. Разумеется, маленькие полигоны не могут содержать больше пикселей целевого класса наземного покрова, чем большие, поэтому я добавил площадь полигона как независимую переменную в модели. Первая модель имеет все предикторы, включительно из тем, эффекты которого я хочу проверить (радиационное заражение почвы), вторая - без радиации. Дисперсионный анализ моделей показывает p-value < 0.05, тобишь предиктор радиации является статистически значимым. Могу ли я быть уверен, что такой подход статистически отделяет эффект площади от эффекта радиации? Эффект площади, разумеется, прямо коррелирует с целевой переменной. Я отдельно построил модели для отфильтрованного датасета (до 50 % процентиля). Там min area = 0,5 гектара, max area = 90 гектаров. А медиана 1.3 га. Т.е. я уменьшил разброс площади к 0.5 до 1.3. И все равно эффект радиации остался значимым. Почему спрашиваю: результаты, мягко говоря, не особо логичны (более сильной радиации соответствует большее количество пикселей, т.е. лесного покрова).

А как собирался датасет? Просто мысль «с полей» - прошлой осенью был как раз в Чернобыльской зоне после пожаров, площади лесов существенно изменяются из-за подобных факторов.

источник

20:17пожаловаться #20