Телеграмм чат группы rlang

О нет. Тесты проверки на нормальность -- бессмысленна вещь. Визуализируйте

Я бы поспорил с этим утверждением

Andrey Morozov in R (язык программирования)

08:09пожаловаться #1

AM

Igor Yegin

Я бы поспорил с этим утверждением

Глаз - алмаз

aGricolaMZ in R (язык программирования)

08:16пожаловаться #2

a

У статистики большие проблемы с тем, чтобы доказывать, что что-то одинаково. Она хорошо показывает, что что-то отличается. Если мы делаем t-test, то стандартная H0 — средние совпадают, H1 — средние не совпадают. Считаем p-value — вероятность увидеть результат как у нас или более экстремальный, если H0 верна. Ну и если p-value меньше заветного 0.05, то мы отвергаем H0. Частая ошибка студентов, это считать, что если p-value больше завтного числа, то мы принимаем H0, ведь на самом деле на этом месте фриквентистская статистика говорит: "мы не можем ни принять, ни опровергнуть H0, идите собирайте все данные заново". Аналогично с тестом на нормальность: H0 — данные распределены нормально, H1 — данные распределены ненормально. Если p-value в таком тесте больше 0.05, то мы не должны радостно бежать и кричать, что у нас нормальные данные, а мы на самом деле не можем, ни принять, ни опровергнуть H0.

Stan in R (язык программирования)

08:49пожаловаться #3

S

У статистики большие проблемы с тем, чтобы доказывать, что что-то одинаково. Она хорошо показывает, что что-то отличается. Если мы делаем t-test, то стандартная H0 — средние совпадают, H1 — средние не совпадают. Считаем p-value — вероятность увидеть результат как у нас или более экстремальный, если H0 верна. Ну и если p-value меньше заветного 0.05, то мы отвергаем H0. Частая ошибка студентов, это считать, что если p-value больше завтного числа, то мы принимаем H0, ведь на самом деле на этом месте фриквентистская статистика говорит: "мы не можем ни принять, ни опровергнуть H0, идите собирайте все данные заново". Аналогично с тестом на нормальность: H0 — данные распределены нормально, H1 — данные распределены ненормально. Если p-value в таком тесте больше 0.05, то мы не должны радостно бежать и кричать, что у нас нормальные данные, а мы на самом деле не можем, ни принять, ни опровергнуть H0.

Это уже надо читать advanced литературу :)

Igor Yegin in R (язык программирования)

09:20пожаловаться #4

IY

У статистики большие проблемы с тем, чтобы доказывать, что что-то одинаково. Она хорошо показывает, что что-то отличается. Если мы делаем t-test, то стандартная H0 — средние совпадают, H1 — средние не совпадают. Считаем p-value — вероятность увидеть результат как у нас или более экстремальный, если H0 верна. Ну и если p-value меньше заветного 0.05, то мы отвергаем H0. Частая ошибка студентов, это считать, что если p-value больше завтного числа, то мы принимаем H0, ведь на самом деле на этом месте фриквентистская статистика говорит: "мы не можем ни принять, ни опровергнуть H0, идите собирайте все данные заново". Аналогично с тестом на нормальность: H0 — данные распределены нормально, H1 — данные распределены ненормально. Если p-value в таком тесте больше 0.05, то мы не должны радостно бежать и кричать, что у нас нормальные данные, а мы на самом деле не можем, ни принять, ни опровергнуть H0.

Насколько я знаю, p-value показывает, какова вероятность, при истинности нулевой гипотезы, получить такое же или более экстремальное значение статистики. Если p-value достаточно велик (больше 0.5, например), то мы можем допустить, что данные имеют распределение, достаточно близкое к нормальному, чтобы пренебречь разницей между истинным распределением и нормальным распределением.

Это нестрогий подход, и его есть, за что покритиковать, но на практике, если за H1 мы будем брать какое-то другое распределение, то по критерию отношения правдоподобия у нас часто будет наблюдаться статистически значимое различие между H0 и H1

09:27пожаловаться #5

ИП

Иван Поздняков... in R (язык программирования)

Igor Yegin

Насколько я знаю, p-value показывает, какова вероятность, при истинности нулевой гипотезы, получить такое же или более экстремальное значение статистики. Если p-value достаточно велик (больше 0.5, например), то мы можем допустить, что данные имеют распределение, достаточно близкое к нормальному, чтобы пренебречь разницей между истинным распределением и нормальным распределением.

Это нестрогий подход, и его есть, за что покритиковать, но на практике, если за H1 мы будем брать какое-то другое распределение, то по критерию отношения правдоподобия у нас часто будет наблюдаться статистически значимое различие между H0 и H1

Угу, только выводы будут зависеть от мощности, то есть от размера выборки. При этом нормальных распределений в природе практически не существует, поэтому вопрос сводится тупо к размеру выборки

09:31пожаловаться #6

A

У статистики большие проблемы с тем, чтобы доказывать, что что-то одинаково. Она хорошо показывает, что что-то отличается. Если мы делаем t-test, то стандартная H0 — средние совпадают, H1 — средние не совпадают. Считаем p-value — вероятность увидеть результат как у нас или более экстремальный, если H0 верна. Ну и если p-value меньше заветного 0.05, то мы отвергаем H0. Частая ошибка студентов, это считать, что если p-value больше завтного числа, то мы принимаем H0, ведь на самом деле на этом месте фриквентистская статистика говорит: "мы не можем ни принять, ни опровергнуть H0, идите собирайте все данные заново". Аналогично с тестом на нормальность: H0 — данные распределены нормально, H1 — данные распределены ненормально. Если p-value в таком тесте больше 0.05, то мы не должны радостно бежать и кричать, что у нас нормальные данные, а мы на самом деле не можем, ни принять, ни опровергнуть H0.

Одинаковость (идентичность) никак не доказывается, а для эквивалентности (различия не больше заданной величины) есть подход, основанный на доверительных интервалах

aGricolaMZ in R (язык программирования)

09:35пожаловаться #7

a

Andrey

Одинаковость (идентичность) никак не доказывается, а для эквивалентности (различия не больше заданной величины) есть подход, основанный на доверительных интервалах

фриквентистских? байесовских? Это история про перекрывающиеся доверительные интервалы? Если да, то, мне кажется, я читал про это — тоже достаточно мутная история. Ну и я не встречал в научных статьях (по лингвистике).

09:37пожаловаться #8

A

В клинических исследованиях норм набутстрепить ДИ для разности медиан или частот, например

10:00пожаловаться #9

A

Это не мутная тема, все по рекомендациям лучших людей из FDA и EMA

10:01пожаловаться #10

IS

Вообще вопрос, кто практикует бутстрап, как оно в практике отзываетсся?

10:01пожаловаться #11

A

Я использую, все хорошо, а что может пойти не так? Тут сразу и свобода от предпосылок стат. методов, и оценка размера эффекта

10:03пожаловаться #12

IS

ну мой извечный вопрос , оценивали по малой выборке, получили результаты. В масштабировании результаты совмем другие. И вот из моих наблюдений т тест дает более предсказуемые результаты чем манн витни.

ну при соблюдении общей гигиены тестирования

10:05пожаловаться #13

DK

Ivan Struzhkov

Вообще вопрос, кто практикует бутстрап, как оно в практике отзываетсся?

я пользуюсь при оценке доверительных интервалов для нелинейных моделей... других способов и не знаю даже ... у Мастицкого хорошо описан бутстреп в книге

10:15пожаловаться #14

DK

Dm Kb

я пользуюсь при оценке доверительных интервалов для нелинейных моделей... других способов и не знаю даже ... у Мастицкого хорошо описан бутстреп в книге

наврал про книгу(( ее не Мастицкий писал

10:21пожаловаться #15

IS

Dm Kb

я пользуюсь при оценке доверительных интервалов для нелинейных моделей... других способов и не знаю даже ... у Мастицкого хорошо описан бутстреп в книге

Да я с теорией вопроса знаком.
Но я вот практические решения вынужден принимать по результатам тестов.
Я готов что тестовые резлультаты при нормальной гигиене теста не совпадают с масштабированием. Меня интересует как это часто у кого бывает.
Условно я т тесту верю больше

10:25пожаловаться #16

DK

Ivan Struzhkov

Да я с теорией вопроса знаком.
Но я вот практические решения вынужден принимать по результатам тестов.
Я готов что тестовые резлультаты при нормальной гигиене теста не совпадают с масштабированием. Меня интересует как это часто у кого бывает.
Условно я т тесту верю больше

мне кажется на поставленный вопрос можно легко ответить с помощью моделирования, нет?

10:27пожаловаться #17

DK

я имею ввиду синтетические данные с заведомо известными параметрами

10:28пожаловаться #18

IS

Ну там то все по науке работает. +/-

10:30пожаловаться #19

IS

и я объяснения могу найти где и что получилось или нет. Но это все послезнения