Size: a a a

R (язык программирования)

2021 March 23

AS

Alexander Semenov in R (язык программирования)
Vladimir Volokhonsky МО 72
Ну, как вот например психологов учат статистике? По большей части это метод поваренной книги с рецептами. В поваренной книге, конечно,  записаны некоторые общие базовые правила, которые должна знать каждая хозяйка. Ну типа столько-то соли должно быть на килограмм блюда. Не оставляйте кастрюлю на плите без присмотра. Тухлую еду не надо готовить. Но по большей части там рецепты. Если вы хотите приготовить оливье - далее перечень ингредиентов и порядок действий. Никто не объясняет там принципы, по которым в оливье должны присутствовать солёные огурцы и ПОЧЕМУ их можно заменить маринованными патиссонами.

Точно так же и с Data Science - объясняешь базовые принципы и различия метолов по тому, какие данные в них можно запихивать, в каких задачах какой метод себя лучше прказывает и вуаля. Проблемой является то, что при попытке применить это всё за рамками учебных задач ты постоянно натыкаешься на множество ситуаций, которые никак в рецептах не описаны. То у тебя выборка дико несбалансированная, то данные имеют четырёхмерную природу, то хрен знает что ещё.
В рецептах не описаны, а в интернетах — очень даже. Ну и чаты есть типа этого.
источник

IY

Igor Yegin in R (язык программирования)
Alexander Semenov
... а потом удивляемся, что никто не знает и не хочет учить теорвер.
По факту, тем не менее. Его запросто можно преподавать и без этого, и так часто делают, и это во многом хороший подход... но если заниматься статистикой как наукой, то без этого сложно
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
Да. Проблема только в том, что я порой совершенно не способен понять ответ, который мне дают в чате. 🙂
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
Статистикой как наукой занимаются в универах на кафедрах профильных. Нам в основном надо фигак-фигак и быстренько получить ответ на наш вопрос, который к статистической науке не имеет отношения.
источник

AS

Alexander Semenov in R (язык программирования)
Vladimir Volokhonsky МО 72
Статистикой как наукой занимаются в универах на кафедрах профильных. Нам в основном надо фигак-фигак и быстренько получить ответ на наш вопрос, который к статистической науке не имеет отношения.
++
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Igor Yegin
Введение в теорвер — это рассказ о сигма-алгебре и аксиомах Колмогорова
А как же чёрные и белые шарики доставать?))
источник

ЮМ

Юта Мата Ссс... in R (язык программирования)
Vladimir Volokhonsky МО 72
Статистикой как наукой занимаются в универах на кафедрах профильных. Нам в основном надо фигак-фигак и быстренько получить ответ на наш вопрос, который к статистической науке не имеет отношения.
Хах, всё так)
calm down and calculate
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
О, раз уж я заглянул в чат, то вот вопрос знатокам roxygen. Как экранировать процентики?
# %bottom% ------------------------------------------------------------
#' @title %bottom%
#' @param x vector
#' @param move elements to move end
#' @description move elements of x that intersects with y to the tail of the vector x
#' @export

`%bottom%`<-function(x,move)
 {
 c(x %del% move,intersect(y,move))
 }
В точно такой же функции с другим названием при создании доков title сам избавляется от процентиков. А тут почему-то нет.
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
Получается вот такая вот дичь, которая не даёт собрать пакет.
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
Если что, то в этом пакете используются ещё функции
`%del%` <- function (x, y)   {x[x %notin% y]}
`%notin%` <- function (x, y) {!(x %in% y)}
и они без проблем собираются в документацию.
источник

VV

Vladimir Volokhonsky... in R (язык программирования)
Ну то есть так-то в title можно что угодно писать... Просто интересно, как экранировать процентики.
источник

PU

Philipp Upravitelev in R (язык программирования)
двойные %% попробуй
источник

DU

Denis Usalev in R (язык программирования)
Добрый вечер! Есть вопрос по статистике: чтобы проверить распределение на логнормальность, достаточно взять логарифм и проверить на обычную нормальность тем же Шапиро-Уилком, к примеру? Или есть подводные камни?
источник
2021 March 24

IY

Igor Yegin in R (язык программирования)
Denis Usalev
Добрый вечер! Есть вопрос по статистике: чтобы проверить распределение на логнормальность, достаточно взять логарифм и проверить на обычную нормальность тем же Шапиро-Уилком, к примеру? Или есть подводные камни?
Да, логнормальное распространение по определению получается взятием экспоненты от нормально распределённых величин. Поэтому вы вправе делать то, что вы описали
источник

DU

Denis Usalev in R (язык программирования)
Igor Yegin
Да, логнормальное распространение по определению получается взятием экспоненты от нормально распределённых величин. Поэтому вы вправе делать то, что вы описали
Спасибо!
источник

a

aGricolaMZ in R (язык программирования)
Denis Usalev
Добрый вечер! Есть вопрос по статистике: чтобы проверить распределение на логнормальность, достаточно взять логарифм и проверить на обычную нормальность тем же Шапиро-Уилком, к примеру? Или есть подводные камни?
О нет. Тесты проверки на нормальность -- бессмысленна вещь. Визуализируйте
источник

PU

Philipp Upravitelev in R (язык программирования)
либо можно взять какой-нибудь gamlss, взять несколько распределений для теста, и по aic посмотреть, какое лучше фитится и с какими параметрами %)
источник

EP

Ed P in R (язык программирования)
Denis Usalev
Добрый вечер! Есть вопрос по статистике: чтобы проверить распределение на логнормальность, достаточно взять логарифм и проверить на обычную нормальность тем же Шапиро-Уилком, к примеру? Или есть подводные камни?
Да, подводный камень - проверять на нормальность есть смысл только небольшие выборки.

Если у вас сотни наблюдений, то даже небольшое искажение уже приведет к отклонению гипотезы о нормальности, хотя с данными м.б. все ОК. Колмогоров-Сммрнов этим грешит, н-р. В качестве альтернативы лучше гистограмму или боксплот построить, чтобы убедиться в форме распределения.

Еще подводный камень с интерпретацией логарифмиррванных переменных. После анализа результаты надо экспонировать, чтобы привести к исходным единицам
источник

DU

Denis Usalev in R (язык программирования)
Спасибо за ответы!
источник