Телеграмм чат группы rlang_ru страница 2410

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R (язык программирования)

1222 membersпожаловаться на группу

2020 October 04

IS

Ivan Struzhkov in R (язык программирования)

Ксения Сайфулина

Поняла, попробую на другом примере. Есть 300 городов. Меня интересует, в каких городах есть линейная зависимость переменной А (уровня счастья людей) от переменной B (уровня освещенности). Можно ли посчитать линейную регрессию А от B для каждого города, взять все полученные p-значения, сделать поправку fdr, чтобы избежать опасности множественных сравнений, и на основе этих скорректированных p делать выводы?

а в чем смысл такого подхода? У вас на разведочном анализе есть какая то гипотеза?
я бы для начала просто принадлежность к городу взял как предиктор и посмотрел бы что будет с моделью. может потом как то фичей наделать

ну и по смыслу у вас же не 300 гипотез, гиптотеза одна, в данных есть просто переменная - город

источник

10:08пожаловаться #1

КС

Ксения Сайфулина... in R (язык программирования)

а в чем смысл такого подхода? У вас на разведочном анализе есть какая то гипотеза?
я бы для начала просто принадлежность к городу взял как предиктор и посмотрел бы что будет с моделью. может потом как то фичей наделать

ну и по смыслу у вас же не 300 гипотез, гиптотеза одна, в данных есть просто переменная - город

Спасибо большое за ответ! Я опасалась вводить город как предиктор, потому что города очень разные, и я совсем не предполагаю, что зависимость А от В есть везде. Она есть, скажем, в 20 городах из 300, и я как раз хочу их вычленить. Модель с двумя факторами, насколько я понимаю, покажет, что зависимости А от В нет, раз она так редко встречается.

источник

10:58пожаловаться #2

ГД

Григорий Демин... in R (язык программирования)

Ксения Сайфулина

Спасибо большое за ответ! Я опасалась вводить город как предиктор, потому что города очень разные, и я совсем не предполагаю, что зависимость А от В есть везде. Она есть, скажем, в 20 городах из 300, и я как раз хочу их вычленить. Модель с двумя факторами, насколько я понимаю, покажет, что зависимости А от В нет, раз она так редко встречается.

А уровень освещенности в рамках города варьируется?

источник

11:03пожаловаться #3

ГД

Григорий Демин... in R (язык программирования)

Ну то есть, если вы модели по городам строите, то должен варьироваться

источник

11:04пожаловаться #4

ГД

Григорий Демин... in R (язык программирования)

Можно попробовать так:


lm(a ~ b + city:b + city)

Первый коэффициент - в целом зависимость a от b, а значимые коэффиценты во втором блоке будут показывать, что зависимость a от b может варьироваться между городами

источник

11:08пожаловаться #5

КС

Ксения Сайфулина... in R (язык программирования)

Григорий Демин

Ну то есть, если вы модели по городам строите, то должен варьироваться

Да, варьируется!

источник

12:01пожаловаться #6

КС

Ксения Сайфулина... in R (язык программирования)

Григорий Демин

Можно попробовать так:


lm(a ~ b + city:b + city)

Первый коэффициент - в целом зависимость a от b, а значимые коэффиценты во втором блоке будут показывать, что зависимость a от b может варьироваться между городами

Спасибо за совет! Кажется, это должно подойти!

источник

12:02пожаловаться #7

a

aGricolaMZ in R (язык программирования)

Ксения Сайфулина

Поняла, попробую на другом примере. Есть 300 городов. Меня интересует, в каких городах есть линейная зависимость переменной А (уровня счастья людей) от переменной B (уровня освещенности). Можно ли посчитать линейную регрессию А от B для каждого города, взять все полученные p-значения, сделать поправку fdr, чтобы избежать опасности множественных сравнений, и на основе этих скорректированных p делать выводы?

Efron,_B_,_Hastie,_T_2016_Computer_Age_Statistical_Inference_Vol.pdf

Это известная проблема, про которую можно почитать, например, в этой книжке в начале третьей части. Как уже сказали выше, нужно, чтобы Вы четко сформулировали, что Вы хотите сказать:

1) согласно нашим данным про связь переменных y и x мы можем выделить группу городов А и группу городов Б (кластеризация или empirical bayes estimation)
2) нас интересует связь переменных y и x, какая-то такая общая, игнорирующая информацию про отдельные города (mixed effects model)

источник

12:02пожаловаться #8

a

aGricolaMZ in R (язык программирования)

книжка, кстати одна из любимых, всем рекоммендую

источник

12:05пожаловаться #9

КС

Ксения Сайфулина... in R (язык программирования)

Супер, спасибо! Меня интересует именно первый пункт.

источник

12:24пожаловаться #10

AS

Alexander Semenov in R (язык программирования)

книжка, кстати одна из любимых, всем рекоммендую

Недавно её вспоминал. Её можно использовать, как учебник?

источник

12:42пожаловаться #11

a

aGricolaMZ in R (язык программирования)

я бы считал ее полезным чтением

источник

12:43пожаловаться #12

AS

Alexander Semenov in R (язык программирования)

Просто никак не могу понять ее ЦА.

источник

12:45пожаловаться #13

ГД

Григорий Демин... in R (язык программирования)

Скорее для расширения кругозора. Читать интересно, но большинство вещей с птичьего полета

источник

13:15пожаловаться #14

MM

Mikle Mikle in R (язык программирования)

Ксения Сайфулина

Поняла, попробую на другом примере. Есть 300 городов. Меня интересует, в каких городах есть линейная зависимость переменной А (уровня счастья людей) от переменной B (уровня освещенности). Можно ли посчитать линейную регрессию А от B для каждого города, взять все полученные p-значения, сделать поправку fdr, чтобы избежать опасности множественных сравнений, и на основе этих скорректированных p делать выводы?

А почему бы multilevel не попробовать?

источник

13:21пожаловаться #15

ИП

Иван Поздняков... in R (язык программирования)

Efron,_B_,_Hastie,_T_2016_Computer_Age_Statistical_Inference_Vol.pdf

Это известная проблема, про которую можно почитать, например, в этой книжке в начале третьей части. Как уже сказали выше, нужно, чтобы Вы четко сформулировали, что Вы хотите сказать:

1) согласно нашим данным про связь переменных y и x мы можем выделить группу городов А и группу городов Б (кластеризация или empirical bayes estimation)
2) нас интересует связь переменных y и x, какая-то такая общая, игнорирующая информацию про отдельные города (mixed effects model)

Тут же задача именно на каких электродах/городах есть эффект, а не есть ли сам эффект

источник

14:16пожаловаться #16

ИП

Иван Поздняков... in R (язык программирования)

Ксения Сайфулина

Поняла, попробую на другом примере. Есть 300 городов. Меня интересует, в каких городах есть линейная зависимость переменной А (уровня счастья людей) от переменной B (уровня освещенности). Можно ли посчитать линейную регрессию А от B для каждого города, взять все полученные p-значения, сделать поправку fdr, чтобы избежать опасности множественных сравнений, и на основе этих скорректированных p делать выводы?

Мне кажется, да, все корректно, если не пугает либеральность fdr подхода в целом

источник

14:18пожаловаться #17

КС

Ксения Сайфулина... in R (язык программирования)

Иван Поздняков

Мне кажется, да, все корректно, если не пугает либеральность fdr подхода в целом

Спасибо!

источник

14:40пожаловаться #18

MM

Mikle Mikle in R (язык программирования)

Коллеги, а у кого-нибудь есть опыт участия в соревнованиях на Kaggle на R?
Как это работает? Обучаешь модели на трейне, потом на тесте делаешь предсказания и заливаешь их на Kaggle? Или нужно саму модель залить?

источник

17:16пожаловаться #19

PU

Philipp Upravitelev in R (язык программирования)

модель - если выиграл, попросят показать

источник

17:20пожаловаться #20