Size: a a a

R (язык программирования)

2021 February 15

K

Katharina in R (язык программирования)
Igor Yegin
Потому что, если грубо говоря, логит- и пробит-регрессии предсказывают вероятность того, что объект, чьи независимые переменные равны каким-то конкретным числам, будет принадлежать к 1.

Вероятность не может быть меньше 0 или больше 1, а любая линейная функция может. Поэтому у вас будет фититься не прямая, а сигмоида (функция в виде буквы S)
То есть это из-за того, что зависимая биноминальная. А независимую я могу оставить как бимодальную или обязательно нормализировать как-нибудб?
источник

K

Katharina in R (язык программирования)
Igor Yegin
Потому что, если грубо говоря, логит- и пробит-регрессии предсказывают вероятность того, что объект, чьи независимые переменные равны каким-то конкретным числам, будет принадлежать к 1.

Вероятность не может быть меньше 0 или больше 1, а любая линейная функция может. Поэтому у вас будет фититься не прямая, а сигмоида (функция в виде буквы S)
Там не S, а просто сначала как бы прямая, которая потом начинает падать, как кусок параболы
источник

IY

Igor Yegin in R (язык программирования)
Katharina
То есть это из-за того, что зависимая биноминальная. А независимую я могу оставить как бимодальную или обязательно нормализировать как-нибудб?
Бимодальную, это у вас распределение с двумя модами?
источник

K

Katharina in R (язык программирования)
Igor Yegin
Бимодальную, это у вас распределение с двумя модами?
Да, грубо говоря левый и правый полюс
источник

K

Katharina in R (язык программирования)
Katharina
Да, грубо говоря левый и правый полюс
То есть, много сильно отрицательных и сильно положительных, а посредине дырка
источник

K

Katharina in R (язык программирования)
Katharina
То есть, много сильно отрицательных и сильно положительных, а посредине дырка
Как верблюд)))
источник

IY

Igor Yegin in R (язык программирования)
Katharina
Как верблюд)))
Не думаю, что нормализация сильно поможет. Если вычитать среднее и делить на СКО, то хребты останутся
источник

IY

Igor Yegin in R (язык программирования)
Попробуйте разбить данные на два кластера и по ним уже всё сделать
источник

K

Katharina in R (язык программирования)
Igor Yegin
Не думаю, что нормализация сильно поможет. Если вычитать среднее и делить на СКО, то хребты останутся
Ну вот и да, так и получается
источник

K

Katharina in R (язык программирования)
Igor Yegin
Попробуйте разбить данные на два кластера и по ним уже всё сделать
То есть из одной две сделать переменные
источник

K

Katharina in R (язык программирования)
А есть возможность таки fit a linear model? Чтобы линеальную связь описать, или ее там нет априори и это будет неверная модель и натягивание за уши?
источник

IY

Igor Yegin in R (язык программирования)
Katharina
То есть из одной две сделать переменные
Можно тупо две модели построить, для одного кластера и для другого
источник

K

Katharina in R (язык программирования)
Igor Yegin
Можно тупо две модели построить, для одного кластера и для другого
Для негативного и позитивного по сути?
источник

K

Katharina in R (язык программирования)
Katharina
А есть возможность таки fit a linear model? Чтобы линеальную связь описать, или ее там нет априори и это будет неверная модель и натягивание за уши?
Ну грубо говоря, если я из любопытства убираю family он типа считает linear и даже прямые рисует, но подозреваю, что это неправильно
источник

IY

Igor Yegin in R (язык программирования)
Katharina
А есть возможность таки fit a linear model? Чтобы линеальную связь описать, или ее там нет априори и это будет неверная модель и натягивание за уши?
Эта модель неспроста называется обобщённой линейной, у вас есть линейная зависимость, только она относится не к зависимой переменной, а её логиту.

Почитайте про логит
источник

K

Katharina in R (язык программирования)
Igor Yegin
Эта модель неспроста называется обобщённой линейной, у вас есть линейная зависимость, только она относится не к зависимой переменной, а её логиту.

Почитайте про логит
Хорошо. А график правильно что не прямая? Как же описать модель, ни slope, ни intercept)
источник

K

Katharina in R (язык программирования)
Я просто первый раз в жизни с binomial outcome работаю
источник

K

Katharina in R (язык программирования)
Но она мне все больше и больше нравится)))) а то все прямые, скучно жить😂
источник

IY

Igor Yegin in R (язык программирования)
Katharina
Хорошо. А график правильно что не прямая? Как же описать модель, ни slope, ни intercept)
Почитайте про предельный эффект, это про интерпретацию таких моделей
источник

K

Katharina in R (язык программирования)
Igor Yegin
Почитайте про предельный эффект, это про интерпретацию таких моделей
Спасибо большое!
источник