Size: a a a

R (язык программирования)

2021 June 02

ИП

Иван Поздняков... in R (язык программирования)
dcast/melt взяты из {reshape}/{reshape2}, которые были предыдущим поколением {tidyr}, в котором сначала они заменились на gather/spread, потом на pivot_wider/longer
источник

BA

Bogdan Avramenko in R (язык программирования)
источник

BA

Bogdan Avramenko in R (язык программирования)
dcast топовый. Из недостатков - для тонкой настройки сортировки столбцов/строк надо лезть в factor-ы.
источник

BA

Bogdan Avramenko in R (язык программирования)
Я melt/dcast пользуюсь просто потому, что он хотя бы под более быстрый data.table заточен) А так, я до конца не понимаю смысла существования tidyverse - пакетов.

Использовал оттуда разве что 2-3 сложные функции типа fill и всё.
источник

AI

Anton I in R (язык программирования)
кажется, в той одной группе Вас обманули. Ни припомню здесь жалоб на тему "питон захватил все вакансии".
Из опыта: 3 года назад пришел в компанию, где был единственным R-щиком. На сегодня уже 4 человека в отделе аналитики научились юзать R, еще двое учатся, знание R стало маст хэв в требованиях вакансий.
источник

PU

Philipp Upravitelev in R (язык программирования)
есть data.table::nafill()
источник

М

Марк in R (язык программирования)
были)
источник

МA

Михаил Ad.fesha... in R (язык программирования)
Всем день добрый

По роду деятельности, столкнулся с задачей, которую... незнаю как правильно загуглить)) Надеюсь наведете на мысль (а в идеале даже подскажете модель/метод/пакет?)
Меня интересует определенная ситуация во временных рядах. Приведу пример

Есть данные по дням за длительный период (продажи).  Внутри недели - будни имеют +- одинаковый уровень а выходные уровень выше. Однако периодически бывают случаи, когда 1 из дней (допустим будний) имел не лучшую погоду, из за чего продажи внутри данного дня провалились. Часть продаж этого дня переходит на следующий день (тоесть то что не дошло в 1 день приходит в другой. Напоминает качели)
Увы, незнаю как можно обозвать этот эффект (для поиска в гугле)

Сейчас с этим борюсь 2 способами
1. Беру среднее по будням минус показатель дня. Передаю как фичу
2. Использую лаги (до +14 дней)

Имеется ощущение, что текущая модель не до конца "кушает" данную информацию и скорр можно улучшить.

Собственно основной вопрос - как правильно обозвать данный эффект? (что б хотя бы погуглить смог).
Мб Вы работали с похожей задачей и исп. какие то доп фичи?
Сейчас исп. h2o в R для данной задачи, скорр хороший, но мб у Вас имелся опыт с другой моделью/методом? Мб есть библиотека какая, которая уже учитывает описанный выше нюанс?
В общем буду рад любым Вашим комментам
источник

МA

Михаил Ad.fesha... in R (язык программирования)
м5 ноутбуки шерсчу)) Пока тихо...
источник

DK

Dm Kb in R (язык программирования)
Я бы в качестве базы использовал ARIMA с внешними(экзогенными) придикторами и сезонностью
источник

ED

Evgeniy Dolgin in R (язык программирования)
по идее можно сгладить ряд скользящей средней, и "качели" уйдут
ещё как вариант использовать погоду как фичу (и её лаги), архивы погоды когда-то в интернете находил, хотя для вашей местности (не знаю откуда Вы) не факт что будут
источник

DK

Dm Kb in R (язык программирования)
Прогноз погоды слава богу можно взять готовый ))
источник

PU

Philipp Upravitelev in R (язык программирования)
мда
источник

DK

Dm Kb in R (язык программирования)
Да!!! )) Я уже испугался, что один его вижу
источник

МA

Михаил Ad.fesha... in R (язык программирования)
Погода как фича уже используется) И среднее + среднее скользящее есть.
Находимся по многим городам РФ
Проблема не столько в качелях, сколько попытаться использовать само наличие этих качелей для увеличения точности. Но как обозвать это все - увы...
источник

DK

Dm Kb in R (язык программирования)
Качели хорошо обрабатывает ARIMA и экспоненциальное сглаживание
источник

МA

Михаил Ad.fesha... in R (язык программирования)
ARIMA - (декомпозиция) и по отдельным рядам прогноз - как фича тоже присутствует.
источник

МA

Михаил Ad.fesha... in R (язык программирования)
Правда часто отбрасывается из за высокой корреляции кстати. Рекомендуете попробывать ее оставить все равно?
источник

MC

Makha Cloud in R (язык программирования)
По временным рядам ещё спектральный и топологический анализ хвалят
источник

MC

Makha Cloud in R (язык программирования)
АRIMA - попсовая штучка
источник