Size: a a a

R (язык программирования)

2020 November 03

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Alexander Semenov
Так а чего "статейка"? Вроде бы сейчас, "с высоты" так сказать, построение кластеров на факторах кажется само собой очевидной операцией.
да вот она эта статейка
источник

O

Olga in R (язык программирования)
Alexander Semenov
Так а чего "статейка"? Вроде бы сейчас, "с высоты" так сказать, построение кластеров на факторах кажется само собой очевидной операцией.
это еще бикластеры мне кажется не очень популярны. Я редко их применение вижу, ходя по сути похоже на факторы+кластеры. Только одномоментно.
источник

AS

Alexander Semenov in R (язык программирования)
Olga
это еще бикластеры мне кажется не очень популярны. Я редко их применение вижу, ходя по сути похоже на факторы+кластеры. Только одномоментно.
А также трикластеры, псевдо-трикластеры и псевдо-бимодальные сети (или как я там это чудо математической мысли обозвал) =)
источник

O

Olga in R (язык программирования)
Alexander Semenov
А также трикластеры, псевдо-трикластеры и псевдо-бимодальные сети (или как я там это чудо математической мысли обозвал) =)
трикластеры я так и не поняла как применить к своим задачам. Хотя может у меня просто нет подходящих данных
источник

AS

Alexander Semenov in R (язык программирования)
Там нужны тернарные отношения (лолштоэто?). У Игнатова они хорошо на данных a la imdb работали, где пользователь Х помечает тегом Y фильм Z. Псевдо-бикластеры (или трикластеры, я уже забыл совсем) родились из попытки перенести эту логику на данные из vk.com, где с одной стороны у пользователя есть группы, на которые он подписан, а с другой стороны — интересы (кажется).
источник

AS

Alexander Semenov in R (язык программирования)
Я в этой теме хорошо разбирался буквально пару-тройку дней в далёком 2012 году, когда нужно было доклад на Sunbelt по результатам этих экспериментов рассказывать. Сейчас уже даже названия всех этих сущностей забыл, хотя одну из них сам же и придумал.
источник

O

Olga in R (язык программирования)
Alexander Semenov
Там нужны тернарные отношения (лолштоэто?). У Игнатова они хорошо на данных a la imdb работали, где пользователь Х помечает тегом Y фильм Z. Псевдо-бикластеры (или трикластеры, я уже забыл совсем) родились из попытки перенести эту логику на данные из vk.com, где с одной стороны у пользователя есть группы, на которые он подписан, а с другой стороны — интересы (кажется).
ну вот может до мобильных данных доберусь, там и покластеризую пользователя+геолокацию+время  наример. А вдруг получится тернарными отношениями это все объяснить.
источник

AS

Alexander Semenov in R (язык программирования)
Olga
ну вот может до мобильных данных доберусь, там и покластеризую пользователя+геолокацию+время  наример. А вдруг получится тернарными отношениями это все объяснить.
Звучит как дичь. Игнатов бы одобрил.
источник

AS

Alexander Semenov in R (язык программирования)
Если мне не изменяет память, там должны будут получиться гео-темпоральные кластера.
источник

O

Olga in R (язык программирования)
Alexander Semenov
Звучит как дичь. Игнатов бы одобрил.
возгордился бы
источник

AS

Alexander Semenov in R (язык программирования)
Типа, тут тусуют днём, тут вечером, тут ночью.
источник

AS

Alexander Semenov in R (язык программирования)
Olga
возгордился бы
... и предложил бы написать статью на AIST.
источник

O

Olga in R (язык программирования)
Alexander Semenov
... и предложил бы написать статью на AIST.
amen
источник

EC

Eugeny Chankov in R (язык программирования)
Philipp Upravitelev
коллеги, задачка.
у меня есть вопрос с множественным выбором. есть подозрение, что некоторые выборы коррелируют друг с другом (то есть, про одно и то же)
как это можно оценить?
попарный хи-квадрат делать не хочется. можно примитивно слить все в один паттерн, и потом посчитать частоты.
вроде что-то подобное делал conjoint анализ, но я делал его первый и последний раз году этак в 2008, и то сомнительно.
Здравствуйте. Один из вариантов, на мой взгляд, — воспользоваться лог-линейным анализом. Варианты ответов определяют  dummy переменные (n-мерную таблицу). По этой таблице строим полную лог-лин. модель второго порядка, которую упрощаем по какому-либо критерию (например, AIC).  Убеждаемся, что полученная модель приемлемо предсказывает таблицу (через хи-2 критерий).  Оставшиеся в упрощенной модели элементы второго порядка указывают на зависимость пар переменных.   Правда картину могут смазать возможные малые частоты в n-мерной таблице.
источник
2020 November 04

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
... и предложил бы написать статью на AIST.
ты так говоришь, как будто сам не автор
источник

PU

Philipp Upravitelev in R (язык программирования)
Eugeny Chankov
Здравствуйте. Один из вариантов, на мой взгляд, — воспользоваться лог-линейным анализом. Варианты ответов определяют  dummy переменные (n-мерную таблицу). По этой таблице строим полную лог-лин. модель второго порядка, которую упрощаем по какому-либо критерию (например, AIC).  Убеждаемся, что полученная модель приемлемо предсказывает таблицу (через хи-2 критерий).  Оставшиеся в упрощенной модели элементы второго порядка указывают на зависимость пар переменных.   Правда картину могут смазать возможные малые частоты в n-мерной таблице.
спасибо, любопытное решение
источник

S

Stan in R (язык программирования)
Eugeny Chankov
Здравствуйте. Один из вариантов, на мой взгляд, — воспользоваться лог-линейным анализом. Варианты ответов определяют  dummy переменные (n-мерную таблицу). По этой таблице строим полную лог-лин. модель второго порядка, которую упрощаем по какому-либо критерию (например, AIC).  Убеждаемся, что полученная модель приемлемо предсказывает таблицу (через хи-2 критерий).  Оставшиеся в упрощенной модели элементы второго порядка указывают на зависимость пар переменных.   Правда картину могут смазать возможные малые частоты в n-мерной таблице.
Удваиваю. Аптон сила. Но, как учил Ротмистров, в Экселе с ним проще :))) Хотя и интерпретация — та еще песня.
источник

БА

Байкулов Антон... in R (язык программирования)
ТоваRищи, откуда к Markdown подступиться лучше?!

Хочу отчёты еженедельные автоматом в пдфках раскидывать всем желающим и нежелающим.
источник

AS

Alexey Seleznev in R (язык программирования)
Байкулов Антон
ТоваRищи, откуда к Markdown подступиться лучше?!

Хочу отчёты еженедельные автоматом в пдфках раскидывать всем желающим и нежелающим.
На степике курс анализ данных в R часть 2, 3ий модуль полностью про rmarkdown
источник

ВП

Владимир Попукайло... in R (язык программирования)
Ну, так-то проще просто полистать: https://rmarkdown.rstudio.com/lesson-1.html  и что-то типо: https://cran.r-project.org/web/packages/kableExtra/vignettes/awesome_table_in_html.html
Хотя, я такие еженедельные отчёты на веб-сервер внутренний вешал и формировал в html + в nginx авторизация и доступы всем кому необходимо.
источник