Size: a a a

R (язык программирования)

2021 March 25

St

Snow time in R (язык программирования)
Dm Kb
просто убрать столбец:
iris_grp <- group_by(iris, Species)
bind_cols(
 summarise(iris_grp, across(1:2, sum, .names = "{.col}_sum")),
 summarise(iris_grp, across(3:4, mean, .names = "{.col}_mean"))[, -1]
)
Подскажите, можно ли модифицировать этот код, чтобы схлопнуть строки для одной кампании с учетом значений в другом столбце, в конкретном случае - месяце.
источник

St

Snow time in R (язык программирования)
источник

St

Snow time in R (язык программирования)
просто убрать столбец:
iris_grp <- group_by(iris, Species)
bind_cols(
 summarise(iris_grp, across(1:2, sum, .names = "{.col}_sum")),
 summarise(iris_grp, across(3:4, mean, .names = "{.col}_mean"))[, -1]
)
источник

DK

Dm Kb in R (язык программирования)
Snow time
Подскажите, можно ли модифицировать этот код, чтобы схлопнуть строки для одной кампании с учетом значений в другом столбце, в конкретном случае - месяце.
Если понимать под «схлопнуть» операцию агрегирования т.е. summarize (), то такую операцию можно проводить по нескольким группирующим колонкам: что-то вроде group_by(iris, Species, Months)
источник

St

Snow time in R (язык программирования)
Вроде бы получается, но дублируется один из столбцов, по которому проводили группировку
источник

St

Snow time in R (язык программирования)
Когда здесь 3 аргумента: group_by(iris, Species, Months)
источник

St

Snow time in R (язык программирования)
С двумя аргументами эта задача решалась через добавление [, -1]
источник

St

Snow time in R (язык программирования)
Получилось так:
summarise(iris_grp, across(3:4, mean, .names = "{.col}_mean"))[, -1],
summarise(iris_grp, across(1:2, sum, .names = "{.col}_sum")) [, -2]
источник

DK

Dm Kb in R (язык программирования)
Snow time
С двумя аргументами эта задача решалась через добавление [, -1]
посмотрите здесь базовые операции
источник
2021 March 26

NH

Novruz Hasanov in R (язык программирования)
Все же dplyr это классика но я больше в рутинных операциях склоняюсь к data.table да может функционал не настолько широк но в своей стезе он куда более практичный чтоли. Никаких пайпов все что нужно, квадратные скобки))
источник

ЕТ

Евгений Томилов... in R (язык программирования)
#дRака
источник

IY

Igor Yegin in R (язык программирования)
Господа, как можно сгруппировать данные в data.table и посмотреть, совпадают ли полностью строки в каких-то группах?
источник

PD

Pavel Demin in R (язык программирования)
утро - тяжелое время суток. наверняка, кто-то сделает это нормально, но….
источник

PD

Pavel Demin in R (язык программирования)

dt = as.data.table(mtcars)[, .(cyl, disp)][order(cyl, disp)]

dt[, .(N = .N, N_unique = uniqueN(.SD)), by = cyl
  ][, all_rows_equal := N == N_unique][]
источник

PD

Pavel Demin in R (язык программирования)
я поплавился:
dt[, .(all_rows_unique = uniqueN(.SD) < .N), by = cyl]
источник

IY

Igor Yegin in R (язык программирования)
Pavel Demin
я поплавился:
dt[, .(all_rows_unique = uniqueN(.SD) < .N), by = cyl]
Спасибо большое!
источник

ИП

Иван Поздняков... in R (язык программирования)
Всем привет!

Я снова пишу о курсе по R и статистике, который уже очень скоро начнется, но на который еще есть шанс успеть записаться.

Недавно появился FAQ по курсу.

По коду STATANDR2021 можно получить скидку 10%!

Специально для родного чатика хочу еще добавить и ответить на недавний вопрос о том, как в курсе проходят статистику: мы делаем фокус не на рецептах, а на логике, которая стоит за ними. Мы подробно разбираем логику NHST, самостоятельно расчитываем базовые тесты в R (в начале даже без использования готовых функций), чтобы было понятно, что стоит за тестовыми статистиками, p-value, доверительными интервалами и т.д. Делаем фокус не на том, когда и какие модели и тесты можно применять, а на том, почему это так, откуда берутся эти допущения и что конкретно будет происходить, если они нарушаются. Но, конечно, по ходу дела учимся делать все основные статистические тесты, благо, если есть R, это совсем несложно.
источник

А

Анатолий in R (язык программирования)
Anton Pysanka
может Levenshtein distance?
возможно, знаете как в R считать эту метрику не для символов, а для "целых" слов в двух строках?
источник

AP

Anton Pysanka in R (язык программирования)
Анатолий
возможно, знаете как в R считать эту метрику не для символов, а для "целых" слов в двух строках?
не знаю. варианты решения:
- загуглить
- посмотреть алгоритм расчета (или исходный код функции для символов) и реализовать свою функцию
источник

ГД

Григорий Демин... in R (язык программирования)
Анатолий
возможно, знаете как в R считать эту метрику не для символов, а для "целых" слов в двух строках?
adist("пиво", "хлеб")
источник