Size: a a a

R (язык программирования)

2020 October 02

AS

Alexey Seleznev in R (язык программирования)
Там все подробно описано, и примеры есть
источник

PV

Pavel Veretennikov in R (язык программирования)
я полистал чат и уже читаю, да)

Все время забываю, что алгоритм должен быть такой:
1) Понять задачу
2) Поискать, не написана ли у Алексея статья на эту тему
3) Если нет — Искать другое решение
источник

PV

Pavel Veretennikov in R (язык программирования)
)
источник

DK

Dm Kz in R (язык программирования)
источник
2020 October 03

PU

Philipp Upravitelev in R (язык программирования)
господа, кто знает изящный способ сделать оконную сумму в data.table?
типа посчитать для каждого дня количество пользователей за последние 7 дней
я могу это сделать с помощью sapply, но хочется более лаконичное решение
источник

PU

Philipp Upravitelev in R (язык программирования)
frollsum() тоже решение, конечно
но чревато ошибками, я бы предпочел более строго задавать границы интервала, чем просто сумма последних n строк
источник

А

Александр in R (язык программирования)
Philipp Upravitelev
господа, кто знает изящный способ сделать оконную сумму в data.table?
типа посчитать для каждого дня количество пользователей за последние 7 дней
я могу это сделать с помощью sapply, но хочется более лаконичное решение
Сходу не придумал как это сделать без apply. Но разве только если конвертнуть дату в недели в соседнюю колонку и сделать groupby. Потом добавить к дате день и сделать тоже самое самое. В цикле из 6 итераций гарантированно посчитайте оконную сумму для каждого дня
источник

АК

Артём Клевцов... in R (язык программирования)
Philipp Upravitelev
господа, кто знает изящный способ сделать оконную сумму в data.table?
типа посчитать для каждого дня количество пользователей за последние 7 дней
я могу это сделать с помощью sapply, но хочется более лаконичное решение
Как данные выглядят? Дата и число?
источник

АК

Артём Клевцов... in R (язык программирования)
Philipp Upravitelev
frollsum() тоже решение, конечно
но чревато ошибками, я бы предпочел более строго задавать границы интервала, чем просто сумма последних n строк
Это самый быстрый и оптимальный вариант. Если есть пропуски во временных рядах, просто заполни их предварительно нулями.
источник

PU

Philipp Upravitelev in R (язык программирования)
Артём Клевцов
Как данные выглядят? Дата и число?
да, дата и число
типа даты заходов пользователей, а хочется посчитать скользящее mau/wau
источник

JS

Jury Sergeev in R (язык программирования)
Есть ещё rollify
источник

IS

Ivan Struzhkov in R (язык программирования)
rol_sum() есть
источник

IS

Ivan Struzhkov in R (язык программирования)
если скорость важна то что то такое должно сработать
rsum.cumsum <- function(x, n = 3L) tail(cumsum(x) - cumsum(c(rep(0, n), head(x, -n))), -n + 1)
источник

PU

Philipp Upravitelev in R (язык программирования)
у меня вот такое грязное решение, но оно не требует допилки данных
> auth_stat[1:3]
  login_date  dau
1: 2020-06-01  733
2: 2020-06-02 1108
3: 2020-06-03 1422


auth_stat[, mau := sapply(login_date, function(x)
 auth[login_date %between% c(x - 30, x), uniqueN(user_id)])]
источник

PU

Philipp Upravitelev in R (язык программирования)
если считать, что данные корректные и прочее, то frollsum будет и правда и лаконичнее, и подозреваю, быстрее всего
источник

PU

Philipp Upravitelev in R (язык программирования)
не, frollsum не подойдет для вычисления mau, потому что сумма dau за последние 30 дней почти никогда не ровна mau
источник

КС

Ксения Сайфулина... in R (язык программирования)
Добрый день! Вопрос по применению линейных моделей на данных ЭЭГ/МЭГ, может, кто-то сможет помочь? У меня есть LMM c одним фиксированным эффектом, и я хочу понять, для каких каналов (их около 300) этот эффект значим. Оптимален ли такой способ: прогнать модель на всех каналах, получить вектор p-значений, а потом сделать поправку fdr?
источник

IS

Ivan Struzhkov in R (язык программирования)
Ксения Сайфулина
Добрый день! Вопрос по применению линейных моделей на данных ЭЭГ/МЭГ, может, кто-то сможет помочь? У меня есть LMM c одним фиксированным эффектом, и я хочу понять, для каких каналов (их около 300) этот эффект значим. Оптимален ли такой способ: прогнать модель на всех каналах, получить вектор p-значений, а потом сделать поправку fdr?
Очень специфично сформулирован вопрос. Возможно будет проще понять, если откинуть отраслевую специфику , показать семпл данных и сформулировать проблему в общем в виде в понятных терминах
источник
2020 October 04

КС

Ксения Сайфулина... in R (язык программирования)
Ivan Struzhkov
Очень специфично сформулирован вопрос. Возможно будет проще понять, если откинуть отраслевую специфику , показать семпл данных и сформулировать проблему в общем в виде в понятных терминах
Поняла, попробую на другом примере. Есть 300 городов. Меня интересует, в каких городах есть линейная зависимость переменной А (уровня счастья людей) от переменной B (уровня освещенности). Можно ли посчитать линейную регрессию А от B для каждого города, взять все полученные p-значения, сделать поправку fdr, чтобы избежать опасности множественных сравнений, и на основе этих скорректированных p делать выводы?
источник

A

Alexander in R (язык программирования)
Не думаючто тут линейная зависимость. Темнота тоже иногда нужна для счастья.
источник