Size: a a a

R (язык программирования)

2020 December 22

АК

Артём Клевцов... in R (язык программирования)
Байкулов Антон
Есть около 13 тысяч чеков. В каждом есть сумма заказа. Хочу их сгруппировать по диапазонам. Например чеки от 1 000 до 10 000, кол-во 438 чеков на сумму 5 000 000 и т.д.
cut смотри. Помимо интервалов можно количество бинов указать.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Arsenii Zed
Нет, для хи-квадрат H0 - это независимость групп, для МакНемара - то, что признаки не изменились значимо (т.е. пациенты остались примерно на главной диагонали). Идеальный случай по H0 МакНемара будет иметь очень большую значимость по хи-квадрату, т.к. у нас прямая зависимость: все признаки по первой категории сохранились и для второй категории.

Вот туть есть инфа
http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_%D0%9C%D0%B0%D0%BA-%D0%9D%D0%B8%D0%BC%D0%B0%D1%80%D0%B0

EDIT: ну я даже не совсем до конца объяснил, но суть в том, что мы смотрим на отклонение в разные стороны от диагонали, а не в общем смысле
Ну, вот. То есть, я не могу свою табличку никак проанализировать, получается?
источник

AZ

Arsenii Zed in R (язык программирования)
Евгений Томилов
Ну, вот. То есть, я не могу свою табличку никак проанализировать, получается?
Не уверен, насколько я помню, там есть аж 2 разные поправки для учета нулей
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Виктор
Коллеги подскажите плз как сделать динамический прогресс-бар? ну типа как в коннекторах в Рекламным системам - Processing|==== которая заполняется по мере прогресса
Всегда делайте поиск по чату, уже обсуждали и кидали ссылки
источник

АК

Артём Клевцов... in R (язык программирования)
Виктор
Коллеги подскажите плз как сделать динамический прогресс-бар? ну типа как в коннекторах в Рекламным системам - Processing|==== которая заполняется по мере прогресса
Гуглится очень легко же: r progress bar.
источник

EP

Ed P in R (язык программирования)
Байкулов Антон
Есть около 13 тысяч чеков. В каждом есть сумма заказа. Хочу их сгруппировать по диапазонам. Например чеки от 1 000 до 10 000, кол-во 438 чеков на сумму 5 000 000 и т.д.
А разве это не задача на поиск кластеров? Я бы графическими способами сначала посмотрел, какие вообще есть чеки и как они группируются.

Еще м.б. можно разложить все заказы в порядке возрастания и нарисовать кумулятивную кривую. После этого можно посмотреть, в каких местах она красиво делится на части
источник

EP

Ed P in R (язык программирования)
Насчет кривой - что-то вроде двух графиков. Сверху waterfall plot со списком всех чеков по возрастающей. Внизу кумулятивный график. По идее вам сразу будут видны и кластеры, и их общий вклад в сумму продаж
источник

БА

Байкулов Антон... in R (язык программирования)
Ed P
А разве это не задача на поиск кластеров? Я бы графическими способами сначала посмотрел, какие вообще есть чеки и как они группируются.

Еще м.б. можно разложить все заказы в порядке возрастания и нарисовать кумулятивную кривую. После этого можно посмотреть, в каких местах она красиво делится на части
Ну примерно так я и попробовал поступить вначале. Округлил значения до тысячных, и вывел гистограмму с чеками. У меня по сути два параметра: количество чеков и сумма одинаковых чеков
источник

EP

Ed P in R (язык программирования)
Байкулов Антон
Ну примерно так я и попробовал поступить вначале. Округлил значения до тысячных, и вывел гистограмму с чеками. У меня по сути два параметра: количество чеков и сумма одинаковых чеков
Ну вот типа того. Просто гистограмма обычно считает число чеков на оси Y, и из нее неочевидно, когда куча мелких чеков по сумме приближается к небольшому числу крупных покупок
источник

БА

Байкулов Антон... in R (язык программирования)
Ed P
Ну вот типа того. Просто гистограмма обычно считает число чеков на оси Y, и из нее неочевидно, когда куча мелких чеков по сумме приближается к небольшому числу крупных покупок
Две гистограммы?)
источник

БА

Байкулов Антон... in R (язык программирования)
Одна по количеству, другая по округленным суммам
источник

EP

Ed P in R (язык программирования)
Доберусь до компа и смогу нарисовать пример.

Попробуйте сделать два графита один под другим:
1) сверху водопад по всем чекам по возрастающей
2) внизу как бы тот же водопад, но с накопленным итогом.

У вас Нижний график красиво поделится на прямоугольники. Ну или так у меня в голове картинка представляется.

Когда вы увидите деление на группы, тогда уже в базе можно будет задать условия, какой группе принадлежит чек
источник

БА

Байкулов Антон... in R (язык программирования)
Картинка конечно хорошая - но есть в ней один недостаток. Мои руки, я в ggplot только со словарём пока могу=)

Вообще задача не прикладная пока что, просто я слышал как умные люди сегментируют пользователей по группам и проводят анализ, а я хочу научиться делать нечто подобное силами R, просто меняя критерии(сумма чек, дней до заказа, повторные заказы и т.д.).
источник

EP

Ed P in R (язык программирования)
Байкулов Антон
Картинка конечно хорошая - но есть в ней один недостаток. Мои руки, я в ggplot только со словарём пока могу=)

Вообще задача не прикладная пока что, просто я слышал как умные люди сегментируют пользователей по группам и проводят анализ, а я хочу научиться делать нечто подобное силами R, просто меняя критерии(сумма чек, дней до заказа, повторные заказы и т.д.).
Я именно в ритейле не знаю, как принято. Просто задача звучит как поиск кластеров с одним дополнительным условием.

Группировать покупки можно же через k-means, наверное. По крайней мере на курсерах этот алгоритм описан.

А в вашем случае задача усложняется тем, что вы хотите группы видеть примерно равного размера.

Т.е. несколько мелких групп у вас может влиться в одну и вопрос, как это выделить/увидеть
источник

EP

Ed P in R (язык программирования)
Если вы просто k-means посчитайте, то потом размер каждой группы (сумму покупок в группе) можно сделать в виде tile plot и увидеть, какие группы надо объединить.

Как искать кластеры с учетом общего "веса" кластера я тоже так сходу не скажу. Но вдруг это уже описано не раз :)
источник

AP

Anton Pysanka in R (язык программирования)
скорее всего гистограмма по сумме чеков выглядит так, причем именно так гладенько, что визуально не разобьешь. для кластеризации нужны бы еще какие-то переменные из чеков, чтобы образовались группы
источник

БА

Байкулов Антон... in R (язык программирования)
Anton Pysanka
скорее всего гистограмма по сумме чеков выглядит так, причем именно так гладенько, что визуально не разобьешь. для кластеризации нужны бы еще какие-то переменные из чеков, чтобы образовались группы
После округления до тысяч
источник

AS

Alexander Semenov in R (язык программирования)
https://www.youtube.com/watch?v=BQMDOxWGrQg Даже интересно стало, насколько эта идея за год продвинулась.
источник
2020 December 23

O

Olga in R (язык программирования)
Подскажите мне, пожалуйста в shiny DT:
у меня большая таблица (много колонок), Приходится скролить вправо-влево. При этом таблица заходит на slider bar 😭😭😭
В какой опции это поменять, чтобы она на месте оставалась?
источник

a

aGricolaMZ in R (язык программирования)
это в сочитании с shiny?
источник