Size: a a a

R language and Statistical data analysis

2019 November 20

СИ

Сергей Ильин in R language and Statistical data analysis
Здравствуйте. Вопрос: сталкивался ли кто-то с статистической библиотекой cooptrees?
конекретно интересует расчет вектора Шепли.
источник

AS

Alexander Semenov in R language and Statistical data analysis
Для feature importance его в SHAP считают. С расчётом его as is не сталкивался.
источник

СИ

Сергей Ильин in R language and Statistical data analysis
Alexander Semenov
Для feature importance его в SHAP считают. С расчётом его as is не сталкивался.
нет, это не для ml ((
источник

АК

Андрей Кобзев in R language and Statistical data analysis
Danil
подскажите пожалуйста, вот я делаю kmeans и получил 3 кластера. соответствуют ли, допустим, кластер 1 первому типу из изначальных данных?
Нет
источник

NK

ID:854618692 in R language and Statistical data analysis
⌨️
Есть в принципе несколько способов которые приходят на ум - либо, как простые смертные, итерировать циклом for и группировать данные, либо сначала рассчитать индексы а потом уже по индексам за раз все собрать. В первом случае мне кажется будет больше аллокаций но коллекция пройдется один раз, во втором - меньше аллокаций но итерировать придется два раза.
Отписываюсь, как и обещал.
источник

NK

ID:854618692 in R language and Statistical data analysis
ID:854618692
Закинул все в data frame как одну колонку.

Посчитал количество символов в каждой строке и, отдельно, количество двоеточий в каждой строке. Добавил это в качестве двух колонок в data frame.
Получилось, что одна из двух нужных колонок (год и сумма) имеет уникальное количество двоеточий, а лишние колонки - уникальное количество символов в строке.

Отфильтровал.

Получилось что-то типа:

1   221525
2   2015-1:  96:  11:   0.85:
3   2015-2:  46:  51:   0.72:
4   367483
5   2015-3:  84:  14:   0.69:
6   346716
7   2015-4:  62: 17:   0.73
8   2015-5:  91: 21:   0.89
9   2015-6:  84: 27:   0.83



Теперь пытаюсь понять, как мне код предприятия перенести на одну строчку с каждым платежом
После всего этого сделал следующее:
источник

NK

ID:854618692 in R language and Statistical data analysis
Во всех оставшихся строках, кроме строк с кодом предприятий, было одинаковое количество двоеточий.

Я добавил такое же количество двоеточий в строки с кодом предприятий. А остальным добабил двоеточие перед каждой строкой.
После чего разделил все по двоеточию.
Получилось что-то типа:

Х1            Х2     Х3  Х4  Х5
25346            
           2015-1  96  12  0.85
           2015-2  54  10  0.76
34575
          2015-3   89  21  0.81


Потом Х1 заполнил с помощью fill.
И оставил все не пустые значения Х2.

Все ))
источник

NK

ID:854618692 in R language and Statistical data analysis
Philipp Upravitelev
вы можете дать датасет или часть датасета, чтобы я покрутил-попарсил его?
Спасибо за отзывчивость.
Приятно, что в группе обращают внимание на чужие проблемы ))

Простите, что сразу не отписался. Реально вошёл в азарт с этими данными.

Не скинул, сразу.
Думал, что уж если срвсем края, тогда скину.

Еше раз спасибо за отзывчивость )
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
велкам
источник
2019 November 21

⌨️ in R language and Statistical data analysis
ID:854618692
Отписываюсь, как и обещал.
Интересное решение, всегда любопытно помотреть на проблему чужими глазами. Спасибо
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
ID:854618692
Спасибо за отзывчивость.
Приятно, что в группе обращают внимание на чужие проблемы ))

Простите, что сразу не отписался. Реально вошёл в азарт с этими данными.

Не скинул, сразу.
Думал, что уж если срвсем края, тогда скину.

Еше раз спасибо за отзывчивость )
для этого группа создавалась, при этом от полноты информации и данных в вопросе к участникам тут зависит полнота, срок и качества ответа на этот вопрос
источник

J

Janzeero in R language and Statistical data analysis
Доброй ночи, на убунту 19.10 не ставится CUDA. Нашел гайд в интернете...
источник

J

Janzeero in R language and Statistical data analysis
источник

J

Janzeero in R language and Statistical data analysis
вторая команда не пашет, выдает такой эррор:
источник

J

Janzeero in R language and Statistical data analysis
Failed to verify gcc version. See log at /var/log/cuda-installer.log for details.
источник

J

Janzeero in R language and Statistical data analysis
А лог открыть не могу - нет прав)
источник

АК

Артём Клевцов in R language and Statistical data analysis
Janzeero
А лог открыть не могу - нет прав)
От рута надо же.
источник

J

Janzeero in R language and Statistical data analysis
Артём Клевцов
От рута надо же.
Очевидно, что я запорол предыдущей установкой новую. Чисто не инсталлирует...
источник

J

Janzeero in R language and Statistical data analysis
https://www.pugetsystems.com/labs/hpc/How-To-Install-CUDA-10-1-on-Ubuntu-19-04-1405/ Дошел до шага 5, линк предоставлен был в шаге 4 по ссылке, и дает ссылку на этот лог...
источник

J

Janzeero in R language and Statistical data analysis
Как перезапустить процесс? А то советует убрать предыдущий драйвер, но не специфицирует, какой...
источник