Size: a a a

R (язык программирования)

2021 February 13

IK

Ivan Krokhalyov in R (язык программирования)
а что такое НМУ?
источник

PU

Philipp Upravitelev in R (язык программирования)
Ivan Krokhalyov
а что такое НМУ?
хтоническое и мифическое место, независимый математический университет
источник

K

Katharina in R (язык программирования)
Привет. А кто-нибудь знает секретненькие packages или код для красивых графиков по linear mixed models? Спасибо
источник

a

aGricolaMZ in R (язык программирования)
ggefects
источник

IS

Ivan Struzhkov in R (язык программирования)
Ivan Krokhalyov
а что такое НМУ?
Математический университет со свободным посещением и без приемных экзаменов.
Организован отколовшимися в 80 предподами мехмата. Нет гос диплома, но признается гарвардом например. Возможно лучшее место в стране что бы учить математику
источник

E

Eкатерина in R (язык программирования)
Здравствуйте. Есть большой набор данных и есть подозрение, что в нем присутствуют повторяющиеся строки. В датасете речь о вещах, которые прибывают в страну: что-то люди просто оформляют на таможне для себя, а что-то потом перепродается. Если дальнейшая перепродажа, то по идее данные о вещи в датасете будут дублироваться, так как данные в этот же датасет заносятся при дальнейшей покупке этой вещи.  Проблема в том, что мне нужно определить уникальные вещи, для дальнейшего анализа,а у них нет никакого постоянного id.
я бы хотела определить уникальные вещи по определенным колонкам. Т.е. если я просто сделаю distinct или duplicated, то ничего не будет, потому что вещь проходит разные этапы регистрации и следовательно не все колонки одинаковы. Какую мне нужно использовать функцию, чтобы увидеть повторяющиеся строки , но по определенным столбцам?
источник

K

Katharina in R (язык программирования)
aGricolaMZ
ggefects
Спасибо. Я знаю effects, это другое?
источник

E

Eкатерина in R (язык программирования)
Katharina
Спасибо. Я знаю effects, это другое?
если не ошибаюсь, то этот пакет например для того, чтобы marginal effects показывать
источник

А[

Александр [capsula]... in R (язык программирования)
Кек
источник

EP

Ed P in R (язык программирования)
лол, вы же буквально вчера собирались начать учить R
источник

PU

Philipp Upravitelev in R (язык программирования)
я чот даже не знаю, как реагировать на такое @@
источник

K

Katharina in R (язык программирования)
Ed P
лол, вы же буквально вчера собирались начать учить R
Я?
источник

А[

Александр [capsula]... in R (язык программирования)
Katharina
Я?
Нене, сообщения удалены, не к вам реплай был :)
источник

K

Katharina in R (язык программирования)
Ааа я уж испугалась))
источник
2021 February 14

AP

Aleksandr Pidtykan in R (язык программирования)
Philipp Upravitelev
уважаемые, дидактический вопрос.
постоянно сталкиваюсь с ситуацией, когда студенты, не имющие опыта работы с языками программирования, путаются в составных задачах. то есть, в рамках темы или конкретной функции они могут все сделать и понимают, как. а вот придумать, как совместить несколько выражений и операций - уже теряются.

например, цитата студента: ", по отдельности понятно, что дает функция, но крайне тяжело получается использовать их вместе, поэтому трачу много времени на попытки все правильно расположить в R".

собственно, вопрос. как с этим работать?
я вроде и даю составные задачки, и учу декомпозировать на выражения. но, видимо, недостаточно, либо все равно сложно.
Я бы попробовал не с векторизации а циклов начинать. Очень хорошая струтура прослеживается:  берем 1 элемн считаем А затем полученный результат приводим к Б.
источник

PU

Philipp Upravitelev in R (язык программирования)
Aleksandr Pidtykan
Я бы попробовал не с векторизации а циклов начинать. Очень хорошая струтура прослеживается:  берем 1 элемн считаем А затем полученный результат приводим к Б.
и потом они везде будут делать циклы, угу. мне тут вместо ifelse уже хотели цикл сделать, а ля питон.
я циклы вообще в курсе даю в самом конце, когда сайт скрапим - там проще циклом пройти по набору страниц. а в других местах как-то и без них хорошо %)
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Philipp Upravitelev
и потом они везде будут делать циклы, угу. мне тут вместо ifelse уже хотели цикл сделать, а ля питон.
я циклы вообще в курсе даю в самом конце, когда сайт скрапим - там проще циклом пройти по набору страниц. а в других местах как-то и без них хорошо %)
Ну вот кстати это "если вы хотите пишите цикл, значит вы пишите не так" в Р может быть даже вредным. Не так страшны циклы, как пуш в вектор и всё вот это вот, о чём тут недавно писалось.

Если хочется плавно ввести в векторизацию, попробуйте через фильтры датасетов или веторов по результатам вызовов функций. Ну там банальное что-то вроде: выведете в консоль все элементы х, меньшие медианы.

А вообще может упор на data.table сыграл злую шутку и "лапша" из тайди помогла бы въехать студентам в тему? Я боюсь опять начинать этот холивар (сам использую и дата тейбл и тайди), но "прокидывание" результатов выполнения одной функции в другую может и правда хорошо вправить мозг на предмет построения каких-то дата пайплайнов и этих всяких флоу. А уж дальше пересаживаемся на дата тейбл и радуемся жизни)
источник

PU

Philipp Upravitelev in R (язык программирования)
ну дело-то не в векторизации, это достаточно сложная механика, как ни крути
у самых слабых проблемы вызывают задачки вида В векторе "vec" замените три случайных значения на NA
таблички дело сильно дальнее, там свои проблемы будут, конечно же. и тоже алгоритмические в первую очередь.
например, вместо %in% студенты любят рисовать лапшу через | или вообще был как-то случай с миллионом вложенных ifelse. или вместо того, чтобы вычислить в группе статистики по трем колонкам, они делают три таблички (по одной колонке) и потом их мерджат.

а сильные просят задачки посложнее, так как эти решают влет. и все это в одной группе.
источник

PU

Philipp Upravitelev in R (язык программирования)
> "лапша" из тайди помогла бы въехать студентам в тему
вот тут, кстати, у меня сомнения. мне было достаточно сложно объяснить парадигму data masking, когда я давал плотли и рвест. а студенты к этому времени уже были достаточно опытные, все же
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Philipp Upravitelev
ну дело-то не в векторизации, это достаточно сложная механика, как ни крути
у самых слабых проблемы вызывают задачки вида В векторе "vec" замените три случайных значения на NA
таблички дело сильно дальнее, там свои проблемы будут, конечно же. и тоже алгоритмические в первую очередь.
например, вместо %in% студенты любят рисовать лапшу через | или вообще был как-то случай с миллионом вложенных ifelse. или вместо того, чтобы вычислить в группе статистики по трем колонкам, они делают три таблички (по одной колонке) и потом их мерджат.

а сильные просят задачки посложнее, так как эти решают влет. и все это в одной группе.
Ну вот как раз про индексацию результатом вызова функции. Если на этом этапе проблемы, то тут только одно: опыт (нарешенность, как тут писали уже).

Из абстрактных советов: развивайте любовь к математике в целом, по жизни помогает. Говорю как любитель)). Говорите, что нет границ и жёстких рамок, пока вы действуете согласно заданной логике. Мне помогало в своё время и даже конструкции вроде names(x) <- c("a", "b") не вызывали вопросов. Это потом я уже ужаснулся тому, что мы результату вызова функции что-то там присваиваем.
источник