Картинка конечно хорошая - но есть в ней один недостаток. Мои руки, я в ggplot только со словарём пока могу=)
Вообще задача не прикладная пока что, просто я слышал как умные люди сегментируют пользователей по группам и проводят анализ, а я хочу научиться делать нечто подобное силами R, просто меняя критерии(сумма чек, дней до заказа, повторные заказы и т.д.).
Я именно в ритейле не знаю, как принято. Просто задача звучит как поиск кластеров с одним дополнительным условием.
Группировать покупки можно же через k-means, наверное. По крайней мере на курсерах этот алгоритм описан.
А в вашем случае задача усложняется тем, что вы хотите группы видеть примерно равного размера.
Т.е. несколько мелких групп у вас может влиться в одну и вопрос, как это выделить/увидеть