Size: a a a

R (язык программирования)

2020 June 01

IS

Ivan Struzhkov in R (язык программирования)
я прошу проещния отвлекся. Честно говоря согласен с предылущим оратором,  если коротко идея с сопоставлением данных - работает из предположения что если модель предсказывает похоже с тестовым  - то и в реальности все хорошо будет
источник

IS

Ivan Struzhkov in R (язык программирования)
Берете данные - разбивааете на тестовые периоды и реальные (реальные это несколько периодов до тестовых) - стоите модель. ПРедстказываате тестовые - сопостаавляете результатами - различными тестами качества пронозов убеждаетесь хороший прогноз или нет
источник

IS

Ivan Struzhkov in R (язык программирования)
Но вообще кажется что то ли что то не так с задачей либо с учебным планом - явно нужны базоввые знания о моделировавании и статистике.
источник

AP

Anton Pysanka in R (язык программирования)
Kate
Но тут и вопрос, как сравнить данные с модели прогноза, с данными второго года.
То есть как интерпретировать модель чтобы их сравнить.
загуглите для старта метрики МАЕ, MAPE, RMSE, RMSPE
если по-простому, то
- у вас должны быть такие данные: реальные данные разбитые на обучающий и тестовый период
- у вас должен быть бейслайн, например прогноз на тестовый период, построенный допустим наивным сезонным методом
- тренируете модель на обучающем периоде
- делаете прогноз на тестовый период
- при помощи метрик сравниваете сработала ли у вас модель лучше чем бейслайн (меньшн ли ошибка)
- пробуете понастраивать модель так, чтобы она была лучше чем бейслайн
источник

K

Kate in R (язык программирования)
Ivan Struzhkov
Но вообще кажется что то ли что то не так с задачей либо с учебным планом - явно нужны базоввые знания о моделировавании и статистике.
Я с вами согласна. Но так вышло.. и сейчас приходится "работать" с чем что есть
источник

IS

Ivan Struzhkov in R (язык программирования)
Посмотрите сообщение выше от Антона - разумный подход
источник

K

Kate in R (язык программирования)
да, я как раз пытаюсь все осознать
источник

K

Kate in R (язык программирования)
и понять.
источник

K

Kate in R (язык программирования)
Большое спасибо за видение, и рекомендации. сейчас будем сидеть и думать, как это можно сделать. и получится ли у нас;
источник

K

Kate in R (язык программирования)
логику я поняла. так как на этом и строятся предсказания. реализацию, сейчас будем думать.
источник

AP

Anton Pysanka in R (язык программирования)
Kate
логику я поняла. так как на этом и строятся предсказания. реализацию, сейчас будем думать.
я как-то проходил один курс по временным рядам – с тех времен остался р-овский ноутбучек на гитхабе https://github.com/AntonPysanka/ts_linearmodeling_r там декомпозиция, линейные модели и те же метрики. но, естественно, чисто учебный ноутбук. если нужно – можете глянуть/проклацать у себя
источник

K

Kate in R (язык программирования)
Anton Pysanka
я как-то проходил один курс по временным рядам – с тех времен остался р-овский ноутбучек на гитхабе https://github.com/AntonPysanka/ts_linearmodeling_r там декомпозиция, линейные модели и те же метрики. но, естественно, чисто учебный ноутбук. если нужно – можете глянуть/проклацать у себя
сейчас гляну. спасибо.
источник

K

Kate in R (язык программирования)
Anton Pysanka
загуглите для старта метрики МАЕ, MAPE, RMSE, RMSPE
если по-простому, то
- у вас должны быть такие данные: реальные данные разбитые на обучающий и тестовый период
- у вас должен быть бейслайн, например прогноз на тестовый период, построенный допустим наивным сезонным методом
- тренируете модель на обучающем периоде
- делаете прогноз на тестовый период
- при помощи метрик сравниваете сработала ли у вас модель лучше чем бейслайн (меньшн ли ошибка)
- пробуете понастраивать модель так, чтобы она была лучше чем бейслайн
по факту это у нас и есть алгоритм машинного обучения.
но тут момент, нам нужно обучать модель, а Дирихле мы вроде как не можем обучать
1.  то есть например мы берем сначало и запускам модель на год ( и сравниваем реальные и пронозы
2. мы делим год на предположим кварталы - и сравниваем у каждого квартала отклонения между актуальной и прогназируемой
далее смотрим где отклонения меньше ( и возможно даже считаем average 4 кварталов и сравниваем эту разницу с годовой разницей - если это будет возможно)
3. если отклонения все еще велики мы делим датасет еще на более мелкие периоды
такова примерно логика?
источник

V

Violet in R (язык программирования)
Зачем здесь машинное обучение?
источник

S

Stan in R (язык программирования)
Я что-то нить немного потерял. У нас же тут обычный time series..
источник

V

Violet in R (язык программирования)
Конечно
источник

K

Kate in R (язык программирования)
Anton Pysanka
загуглите для старта метрики МАЕ, MAPE, RMSE, RMSPE
если по-простому, то
- у вас должны быть такие данные: реальные данные разбитые на обучающий и тестовый период
- у вас должен быть бейслайн, например прогноз на тестовый период, построенный допустим наивным сезонным методом
- тренируете модель на обучающем периоде
- делаете прогноз на тестовый период
- при помощи метрик сравниваете сработала ли у вас модель лучше чем бейслайн (меньшн ли ошибка)
- пробуете понастраивать модель так, чтобы она была лучше чем бейслайн
Антон пишет, про "- тренируете модель на обучающем периоде" поэтому я предположила...
источник

S

Stan in R (язык программирования)
Пока я понял, что мало переменных. Да, автокорреляционная составляющая появится почти сразу же... Но тем не менее
источник

S

Stan in R (язык программирования)
Kate
Антон пишет, про "- тренируете модель на обучающем периоде" поэтому я предположила...
Нене. У Вас есть реальные данные?
источник

K

Kate in R (язык программирования)
да у нас есть данные на два года.
источник