Size: a a a

R (язык программирования)

2020 August 31

АК

Артём Клевцов... in R (язык программирования)
Alexey Seleznev
library(tidyverse)
И можно не разбираться где, что лежит
...
источник

ЕТ

Евгений Томилов... in R (язык программирования)
/fight
источник

a

aGricolaMZ in R (язык программирования)
Alexey Seleznev
library(tidyverse)
И можно не разбираться где, что лежит
видно же по ответам в чате, что Артем не любит такой подход
источник

АК

Артём Клевцов... in R (язык программирования)
aGricolaMZ
видно же по ответам в чате, что Артем не любит такой подход
Это проф. деформация из-за необходимости писать код для прода, где всё должно летать и не есть лишнюю память.
Использование мета-пакетов, которые подгружают кучу других пакетов, приводит к снижению уровня контроля над кодом, что в свою очередь затруднит его дальнейшую отладку и сделает сам код более подверженным ошибкам в силу увеличения количества зависимостей, в  каждой из которых могут содержаться свои ошибки.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Артём Клевцов
Это проф. деформация из-за необходимости писать код для прода, где всё должно летать и не есть лишнюю память.
Использование мета-пакетов, которые подгружают кучу других пакетов, приводит к снижению уровня контроля над кодом, что в свою очередь затруднит его дальнейшую отладку и сделает сам код более подверженным ошибкам в силу увеличения количества зависимостей, в  каждой из которых могут содержаться свои ошибки.
А где пишут в прод на R? Мне приходится всё на Питон потом переписывать.
источник

АК

Артём Клевцов... in R (язык программирования)
Евгений Томилов
А где пишут в прод на R? Мне приходится всё на Питон потом переписывать.
Там, куда я прихожу 😁
источник

АК

Артём Клевцов... in R (язык программирования)
Хотя, бывали случае, когда на R писали и до моего прихода.
источник

IS

Ivan Struzhkov in R (язык программирования)
Артём Клевцов
Там, куда я прихожу 😁
Мощь. Если есть что почитать как настроено и как организовано житие в продакшене было бы круто
источник

АК

Артём Клевцов... in R (язык программирования)
Это отчасти следствие того, что там где мне приходилось работать, не было сформированной команды сатанистов/аналитиков/разрабов со своей экосистемой и жёсткими конвенциями.
источник

S

Stan in R (язык программирования)
Евгений Томилов
А где пишут в прод на R? Мне приходится всё на Питон потом переписывать.
В университетах точно
источник

a

aGricolaMZ in R (язык программирования)
В университете прод?

Я не понимаю этого слова?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
aGricolaMZ
В университете прод?

Я не понимаю этого слова?
*выпускает диплом в продакшн, в самый последний момент переделывая UI*
источник

JS

Jury Sergeev in R (язык программирования)
да на самом деле, что не так то? ну R в проде и что? я лично не вижу каких-то реальных проблем от его использования в проде...
источник

JS

Jury Sergeev in R (язык программирования)
много работаю с данными, ну не больно это, возможно, потому что данные далеко не Big
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Jury Sergeev
много работаю с данными, ну не больно это, возможно, потому что данные далеко не Big
Да и если биг, то всегда есть rspark какой-нибудь.
источник

JS

Jury Sergeev in R (язык программирования)
просто все по месту хорошо, где надо - RDBMS, где-то Clickhouse, и Kafka есть, а где то Redis... у нас много где R, потому что time-to-market малый достаточно
источник

JS

Jury Sergeev in R (язык программирования)
дело-то не в языке и его годности-негодности - просто питонистов много, и они дешевле от этого
источник

JS

Jury Sergeev in R (язык программирования)
на долгих зубодробительных вещах у нас Pentaho DI, но все чаще в нем же вызывается R, для получения данных из API, и преобразования сложно-вложенных json-ответов в табличный вид, очень удобно
источник

JS

Jury Sergeev in R (язык программирования)
вот с drake сдружился, можно и без пентахи обойтись )
источник

AI

Anton I in R (язык программирования)
Janzeero
Здравствуйте. Я построил пару линейных моделей, где целевой переменной является количество пикселей целевого класса наземного покрова, вычисленных для каждого геопространственного полигона (т.е. образцы в тренировочном наборе) разной площади. Разумеется, маленькие полигоны не могут содержать больше пикселей целевого класса наземного покрова, чем большие, поэтому я добавил площадь полигона как независимую переменную в модели. Первая модель имеет все предикторы, включительно из тем, эффекты которого я хочу проверить (радиационное заражение почвы), вторая - без радиации. Дисперсионный анализ моделей показывает p-value < 0.05, тобишь предиктор радиации является статистически значимым. Могу ли я быть уверен, что такой подход статистически отделяет эффект площади от эффекта радиации? Эффект площади, разумеется, прямо коррелирует с целевой переменной. Я отдельно построил модели для отфильтрованного датасета (до 50 % процентиля). Там min area = 0,5 гектара, max area = 90 гектаров. А медиана 1.3 га. Т.е. я уменьшил разброс площади к 0.5 до 1.3. И все равно эффект радиации остался значимым. Почему спрашиваю: результаты, мягко говоря, не особо логичны (более сильной радиации соответствует большее количество пикселей, т.е. лесного покрова).
А как собирался датасет? Просто мысль «с полей» - прошлой осенью был как раз в Чернобыльской зоне после пожаров, площади лесов существенно изменяются из-за подобных факторов.
источник