Size: a a a

R language and Statistical data analysis

2019 November 19

NK

ID:854618692 in R language and Statistical data analysis
ID:854618692
Chr [1:463] "2012-1:   :   : Инф. отсутствует :  :"...
str() возвращает только это.
источник

l

lp in R language and Statistical data analysis
создайте сначала табличку 4*(N/4)

а потом
strsplit
cbind
strsplit
....
))
источник

NK

ID:854618692 in R language and Statistical data analysis
"221525" - это код клиента
"(304)" - класиф.этого клиента
"2015-1" - год и месяц
"96" - сумма покупки
источник

l

lp in R language and Statistical data analysis
lp
создайте сначала табличку 4*(N/4)

а потом
strsplit
cbind
strsplit
....
))
каждый третий элемент можно получить так
x[с(F,F,F,T)]
каждый первый, соответственно наоборот
источник

NK

ID:854618692 in R language and Statistical data analysis
Иногда под клиентом сразу несколько месяцев покупки.
источник

NK

ID:854618692 in R language and Statistical data analysis
ID:854618692
Chr [1:463] "2012-1:   :   : Инф. отсутствует :  :"...
Так выглядят данные сли в течении месяца покупок не было
🤦‍♂
источник

NK

ID:854618692 in R language and Statistical data analysis
lp
каждый третий элемент можно получить так
x[с(F,F,F,T)]
каждый первый, соответственно наоборот
Спасибо. Но каждый раз количество данных с годом и месяцем отличаются
источник

l

lp in R language and Statistical data analysis
ID:854618692
Спасибо. Но каждый раз количество данных с годом и месяцем отличаются
тогда по пятому элементу разбить на элементы списка, а потом lapply
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
lp
тогда по пятому элементу разбить на элементы списка, а потом lapply
хорошо бы еще проверкк на четвертый и шестой элементы сделать, если ряд по 3 или по 5 может быть
источник

⌨️ in R language and Statistical data analysis
ID:854618692
Спасибо. Но каждый раз количество данных с годом и месяцем отличаются
Вы нашли решение?
источник

ЕА

Екатерина Аралина in R language and Statistical data analysis
Ребята, подскажите пожалуйста, была ли у кого-то проблема с кодировкой в старших версиях библиотеки bigrquery?
если да, то как решили?
использую версию 1.2.0, не понимает кириллицу(
источник

D

Danil in R language and Statistical data analysis
подскажите пожалуйста, вот я делаю kmeans и получил 3 кластера. соответствуют ли, допустим, кластер 1 первому типу из изначальных данных?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Danil
подскажите пожалуйста, вот я делаю kmeans и получил 3 кластера. соответствуют ли, допустим, кластер 1 первому типу из изначальных данных?
Вы точно не путаете задачу классификации и кластеризации?
источник

NK

ID:854618692 in R language and Statistical data analysis
⌨️
Вы нашли решение?
Почти. Отпишусь
источник

⌨️ in R language and Statistical data analysis
ID:854618692
Почти. Отпишусь
Есть в принципе несколько способов которые приходят на ум - либо, как простые смертные, итерировать циклом for и группировать данные, либо сначала рассчитать индексы а потом уже по индексам за раз все собрать. В первом случае мне кажется будет больше аллокаций но коллекция пройдется один раз, во втором - меньше аллокаций но итерировать придется два раза.
источник

NK

ID:854618692 in R language and Statistical data analysis
Закинул все в data frame как одну колонку.

Посчитал количество символов в каждой строке и, отдельно, количество двоеточий в каждой строке. Добавил это в качестве двух колонок в data frame.
Получилось, что одна из двух нужных колонок (год и сумма) имеет уникальное количество двоеточий, а лишние колонки - уникальное количество символов в строке.

Отфильтровал.

Получилось что-то типа:

1   221525
2   2015-1:  96:  11:   0.85:
3   2015-2:  46:  51:   0.72:
4   367483
5   2015-3:  84:  14:   0.69:
6   346716
7   2015-4:  62: 17:   0.73
8   2015-5:  91: 21:   0.89
9   2015-6:  84: 27:   0.83



Теперь пытаюсь понять, как мне код предприятия перенести на одну строчку с каждым платежом
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
бросьте пример на несколько строк / циклов последовательности
источник

NK

ID:854618692 in R language and Statistical data analysis
Philipp Upravitelev
бросьте пример на несколько строк / циклов последовательности
Простите, я не совсем понимаю 😂
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
вы можете дать датасет или часть датасета, чтобы я покрутил-попарсил его?
источник

D

Dmitrii in R language and Statistical data analysis
lp
сейчас оч сильно правительство печётся

есть, насколько мне известно, указы сверху о том, чтоб повысить "защищаемость"

а потому - иногда действительно с руками отрывают, без всяких вступительных
Не могу не прокомментить посты про аспирантов.  Сейчас Аспирантура - это ступень образования.  Это ее кардинально отличает от старой формы. Вузу интересны аспиранты защищённые в срок +1 год максимум. Переход (01.01.20)  на проф стандарты делает работу в вузе без степени практически невозможной. Написание диссертации не только научный процесс, но и организационный (формальный). Это все равно, что установить и подключить библиотеку на языке R. :). Нужно выбирать руководителя «нового формата».
источник