Size: a a a

R (язык программирования)

2020 December 23

М

Машка in R (язык программирования)
aGricolaMZ
Google Docs
АйсДан-2021
АйсДан — это зимняя школа по анализу данных от команды организаторов мастерской АнДан на ЛШ.
В этом году Айсдан проводится 19-21 февраля 2021 года в онлайн-формате.

АйсДан2021 будет посвящён скрейпингу и анализу текстовых данных. Формат — максимально интерактивный: никаких полуторачасовых видеолекций, много практики и работа в группе вместе с ассистентом-помощником.

Наша школа подойдёт тем, кто уже умеет кодить в R и считает его если не другом, то хотя бы приятелем, и умеет в преобразования данных и ggplot2 — собственно, на проверку этого факта и направлено тестовое задание. На самой школе мы будем использовать tidyverse, так что вам надо быть к этому готовыми, но в самом тестовом вы можете использовать хоть dplyr, хоть data.table, хоть base R, главное, чтобы на R.

По нашим прикидкам, выполнение тестового займёт у вас от 4 часов чистой работы. Дедлайн для тестового задания — в 23:59 по Москве 11 января. Удачи!
А можно подробнее об этом мероприятии, интересно 🙂
источник

a

aGricolaMZ in R (язык программирования)
а я уже кидал ссылку на пост в вк
источник

a

aGricolaMZ in R (язык программирования)
Переслано от aGricolaMZ
Дорогие, мы решили организовать АйсДан про анализ строк и текстов в R
источник

М

Машка in R (язык программирования)
Платно?
источник

a

aGricolaMZ in R (язык программирования)
Бесплатно
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Машка
Платно?
Задание надо сделать
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
источник
2020 December 24

AI

Artem Ismagilov in R (язык программирования)
Добрый день, подскажите как без создания временных переменных в tidyverse создать колонку — булевый флаг, исходя из значений нескольких других колонок.

понятно как можно это отфильтровать, связка
filter_at и any_vars.

filter_df  <- filter_at(df, vars(matches(“ABC”)), any_vars(. == “Y”)))
Как пример. По идеи такой флаг должен создаваться при фильтрации.

Но хочется оставить датафрейм
источник

EP

Ed P in R (язык программирования)
Artem Ismagilov
Добрый день, подскажите как без создания временных переменных в tidyverse создать колонку — булевый флаг, исходя из значений нескольких других колонок.

понятно как можно это отфильтровать, связка
filter_at и any_vars.

filter_df  <- filter_at(df, vars(matches(“ABC”)), any_vars(. == “Y”)))
Как пример. По идеи такой флаг должен создаваться при фильтрации.

Но хочется оставить датафрейм
Можно минимум двумя способами.

1) в датасете, который вышел по итогам фильтрования можно создать переменную TRUE, оставить только ее и ключевые переменные, и сджойнить обратно с оргиналом.

2) в исходном датасете сделать   %>% mutate(varname = ifelse(здесь все ваши условия, TRUE, FALSE))
источник

AI

Artem Ismagilov in R (язык программирования)
Ed P
Можно минимум двумя способами.

1) в датасете, который вышел по итогам фильтрования можно создать переменную TRUE, оставить только ее и ключевые переменные, и сджойнить обратно с оргиналом.

2) в исходном датасете сделать   %>% mutate(varname = ifelse(здесь все ваши условия, TRUE, FALSE))
джойнить не очень хочется,
а по второму случае если я по не скольким переменным условие пишу сработает ли? передавать чисто имена колонок не очень хотелось бы, так как их может быть очень много, поэтому matches использую.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Artem Ismagilov
Добрый день, подскажите как без создания временных переменных в tidyverse создать колонку — булевый флаг, исходя из значений нескольких других колонок.

понятно как можно это отфильтровать, связка
filter_at и any_vars.

filter_df  <- filter_at(df, vars(matches(“ABC”)), any_vars(. == “Y”)))
Как пример. По идеи такой флаг должен создаваться при фильтрации.

Но хочется оставить датафрейм
iris %>% mutate(boolean_var = any(across(contains("Length"), function(x) x > 2) == TRUE))


Вроде то, что нужно.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Немного топорно, но работает. Соответственно, нужно выбрать должны подходить все колонки или хотя бы одна, а также условие выбрать. Ну, и какие колонки выбираем.
источник

EP

Ed P in R (язык программирования)
Я вот именно вашими функциями не особо пользовался, поэтому сложно сказать, запустятся ли они в mutate ifelse, но можно же попробовать. В крайнем случае если без указания имен переменных не обойтись, то можно перед этим шагом сделать что-то вроде varnames <- names(df) и передавать вектор с именами
источник

R

R in R (язык программирования)
а просто df %>% rowwise() %>% mutate(bool = any(c_across(matches("ABC"))) не дает то, что нужно?
источник

ЕТ

Евгений Томилов... in R (язык программирования)
R
а просто df %>% rowwise() %>% mutate(bool = any(c_across(matches("ABC"))) не дает то, что нужно?
Я так понял, может быть несколько переменных, у которых есть индексы ABC. И надо поставить TRUE, если все или хотя бы одна такая переменная содержат заданное значение.
То есть, нужно задавать этот индекс.
источник

Н

Наталия in R (язык программирования)
aGricolaMZ
18-20 декабря пройдёт онлайн-хакатон Роструда — исследователям предложат изучить данные о занятости россиян во время коронавируса.

Хакатоны — это крутая тема, если вы дата-аналитик или всегда хотели начать заниматься журналистикой данных. Во-первых, там можно найти единомышленников, которые помогут восполнить пробелы в ваших навыках, во-вторых, на хакатоне есть команда экспертов, которые будут консультировать и отвечать на вопросы, а в-третьих — это отличный шанс получить проект в портфолио или даже денежный приз. Общий призовой фонд хакатона — 1 миллион рублей.

Зарегистрироваться можно тут:
https://pandemicdatahack.ru/
Интересно, а кому-нибудь удалось поучаствовать в этом хакатоне?
источник

R

R in R (язык программирования)
Евгений Томилов
Я так понял, может быть несколько переменных, у которых есть индексы ABC. И надо поставить TRUE, если все или хотя бы одна такая переменная содержат заданное значение.
То есть, нужно задавать этот индекс.
а, да, там внутри простых операций над переменными вроде нет, действительно
источник

ЭА

Эдик Амперян... in R (язык программирования)
Как формировать запросы по R в поисковике...

sprintf("How can this be solved in R %s",
       switch(1 + trunc(runif(1, 0, 6)),
              "at all?",
              "in a quick-and-dirty way?",
              "in Hadley-Wickham-style?",
              "without a loop?",
              "without nested loops?",
              "in a way somebody can understand?"))
источник

AI

Artem Ismagilov in R (язык программирования)
Евгений Томилов
iris %>% mutate(boolean_var = any(across(contains("Length"), function(x) x > 2) == TRUE))


Вроде то, что нужно.
Отлично, значит можно свою функцию явно прописывать.
Спасибо.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Эдик Амперян
Как формировать запросы по R в поисковике...

sprintf("How can this be solved in R %s",
       switch(1 + trunc(runif(1, 0, 6)),
              "at all?",
              "in a quick-and-dirty way?",
              "in Hadley-Wickham-style?",
              "without a loop?",
              "without nested loops?",
              "in a way somebody can understand?"))
😂
источник