Телеграмм чат группы rlang

2020 July 04

ЕТ

Евгений Томилов... in R (язык программирования)

Юрий 🐙💻🤖📊📈🚬

Лучшее решение никогда на Винде10 не использовать в пути проекта кириллицу

Угу... Я уже перепилил всё. Но очень загадочно, ПОЧЕМУ так. Каков механизм такого бага.

источник

22:03пожаловаться #1

2020 July 05

AK

Alexandr Klimov in R (язык программирования)

Добрый день!
Помогите, плиз, решить задачку:

Есть столбец table$skills, где категории в разном порядке и количестве записаны текстом. Всего вариантов скилов около 100.

Как написать такой код, который добавит к исходной таблице table 100 новых столбцов-скиллов и проставит 1, если это значение есть в в table$skills?

источник

00:14пожаловаться #2

PU

Philipp Upravitelev in R (язык программирования)

Alexandr Klimov

Добрый день!
Помогите, плиз, решить задачку:

Есть столбец table$skills, где категории в разном порядке и количестве записаны текстом. Всего вариантов скилов около 100.

Как написать такой код, который добавит к исходной таблице table 100 новых столбцов-скиллов и проставит 1, если это значение есть в в table$skills?

чот типа такого

library(data.table)

dt1 <- data.table(
  var1 = c('читать, рисовать', 'читать', 'рисовать')
)
dt1[, index := 1:.N]

dt1_long <- dt1[, list(skill = unlist(strsplit(var1, ', '))), by = index]
dt1_wide <- dcast(dt1_long, index ~ skill, fun.aggregate = length, fill = 0)
dt1 <- merge(dt1, dt1_wide, by = 'index', all.x = TRUE)

источник

00:26пожаловаться #3

AK

Alexandr Klimov in R (язык программирования)

Philipp Upravitelev

чот типа такого

library(data.table)

dt1 <- data.table(
  var1 = c('читать, рисовать', 'читать', 'рисовать')
)
dt1[, index := 1:.N]

dt1_long <- dt1[, list(skill = unlist(strsplit(var1, ', '))), by = index]
dt1_wide <- dcast(dt1_long, index ~ skill, fun.aggregate = length, fill = 0)
dt1 <- merge(dt1, dt1_wide, by = 'index', all.x = TRUE)

Работает! Но есть нюанс: в таком случае алгоритм останавливается на первом вхождение слова (категории скилла), а нужно чтобы записывались все. Т.е. сейчас сумма по всем появившимся столбцам скиллов будет = 1. А должна быть равна к-в вхождений. Как "счетесли" в excel.

Еще не отметил, что хочется привязку к ID строчек в table$skills сохранить. Чтобы скилы отмечались единичками у соответствующих людей в таблице table, а не в отдельной.

По-идее эту задачку можно циклом решить, но не понимаю, как его прописать.
Физическая логика следующая: Берем первый скилл из вектора-справочника, создаем доп столбец в исходной табличке table (например table$Рисовать), идем смотреть где есть вхождение слова "Рисовать" в тексте table$skills, ставим единичку в table$Рисовать. И так по всем скиллам

источник

00:56пожаловаться #4

PU

Philipp Upravitelev in R (язык программирования)

сумма по строке должна быть равна количеству вхождений
а вместо index вполне можно использовать идентификатор наблюдения

источник

02:34пожаловаться #5

AK

Alexandr Klimov in R (язык программирования)

Philipp Upravitelev

сумма по строке должна быть равна количеству вхождений
а вместо index вполне можно использовать идентификатор наблюдения

Спасибо! На свежую голову получилось
🙏

источник

11:06пожаловаться #6

PU

Philipp Upravitelev in R (язык программирования)

👍

источник

11:06пожаловаться #7

PD

Pavel Demin in R (язык программирования)

Друзья, всем привет!
я в очередной раз листал rpubs.com, увидел интересный пост:
https://rpubs.com/czang97/UVA-DSPG-OSS

дело в том, что там в конце карта - она, конечно, глючная, но там есть функционал, который меня жутко заинтересовал. если нажать на точку на карте, то осуществляется геокодинг - сверху появляется атрибут из ОСМ display name.
кто-нибудь знает, как это делается? или автор просто добавил JS код туда?

источник

14:06пожаловаться #8

PD

Pavel Demin in R (язык программирования)

и вообще, я же правильно понимаю, что если автор не опубликовал код в своем файле, то нет возможности его посмотреть?

источник

14:08пожаловаться #9

IT

Inip Tyig in R (язык программирования)

консоль разработчика в любом браузере должна помочь вам

источник

14:11пожаловаться #10

АК

Артём Клевцов... in R (язык программирования)

Pavel Demin

и вообще, я же правильно понимаю, что если автор не опубликовал код в своем файле, то нет возможности его посмотреть?

Это вроде бы стандартный функционал leaflet. Можно добавить текст, который будет показан при наведении и при клике.

источник

14:13пожаловаться #11

АК

Артём Клевцов... in R (язык программирования)

Артём Клевцов

Это вроде бы стандартный функционал leaflet. Можно добавить текст, который будет показан при наведении и при клике.

Ссылку на документацию: https://rstudio.github.io/leaflet/popups.html

источник

14:14пожаловаться #12

E

EK479 in R (язык программирования)

mcd.csv

(29.29 Кб)

Здравствуйте! У меня есть данные из меню масдональдса. Там блюда разбиты на категории. Я хочу сравнить категории и определить, как в среднем различаются калорийность, содержание жиров и другие параметры в зависимости от категории.
1) Является ли проблемой для выполнения этой задачи то, что категории содержат разное количество блюд?
2) Я сравниваю категории, запуская Kruskal-Wallis test. Но этот тест просто показывает то, что есть статистически значимая разница между группами. Далее я запускаю Wilcoxon test pairwise.wilcox.test(df$Calories, df$Category, p.adjust.method = "BH", exact=F, correct=F). Этот тест показывает между какими именно группами есть статистическая разница в калорийности.
Скажите, я правильно делаю, используя эти тесты и в такой последовательности?

источник

14:22пожаловаться #13

PD

Pavel Demin in R (язык программирования)

Артём Клевцов

Это вроде бы стандартный функционал leaflet. Можно добавить текст, который будет показан при наведении и при клике.

я лифлетом в R пользуюсь довольно часто, не встречал такого. я же не про лейблы и попапы простые говорю. если есть минута, посмотрите на сайте, про что я написал. скриншот прилагаю

источник

14:22пожаловаться #14

PD

Pavel Demin in R (язык программирования)

источник

14:22пожаловаться #15

PD

Pavel Demin in R (язык программирования)

Inip Tyig

консоль разработчика в любом браузере должна помочь вам

посмотрел, и как ни странно - понял.
в либе leaflet.extras есть функция “addReverseSearchOSM”. Не знаю, как я ее сразу не заметил…

источник

14:32пожаловаться #16

АК

Артём Клевцов... in R (язык программирования)

Pavel Demin

я лифлетом в R пользуюсь довольно часто, не встречал такого. я же не про лейблы и попапы простые говорю. если есть минута, посмотрите на сайте, про что я написал. скриншот прилагаю

Не сразу понял о чём речь. Это реверсивный геокодинг. Есть плагин отдельный для этого.

источник

14:33пожаловаться #17

А[

Александр [capsula]... in R (язык программирования)

EK479

mcd.csv

(29.29 Кб)

Здравствуйте! У меня есть данные из меню масдональдса. Там блюда разбиты на категории. Я хочу сравнить категории и определить, как в среднем различаются калорийность, содержание жиров и другие параметры в зависимости от категории.
1) Является ли проблемой для выполнения этой задачи то, что категории содержат разное количество блюд?
2) Я сравниваю категории, запуская Kruskal-Wallis test. Но этот тест просто показывает то, что есть статистически значимая разница между группами. Далее я запускаю Wilcoxon test pairwise.wilcox.test(df$Calories, df$Category, p.adjust.method = "BH", exact=F, correct=F). Этот тест показывает между какими именно группами есть статистическая разница в калорийности.
Скажите, я правильно делаю, используя эти тесты и в такой последовательности?

1. Зависит от постановки задачи. Если вы смотрите разницу в категориях, все ок, если хотите найти разницу по калоражу в среднем - выведите не сумму, а среднее
2. Для постхока я бы рекомендовал критерий Данна из пакета FSA

источник

15:18пожаловаться #18

E

EK479 in R (язык программирования)

Александр [capsula]

1. Зависит от постановки задачи. Если вы смотрите разницу в категориях, все ок, если хотите найти разницу по калоражу в среднем - выведите не сумму, а среднее
2. Для постхока я бы рекомендовал критерий Данна из пакета FSA

Спасибо!

источник

15:23пожаловаться #19

БА

Байкулов Антон... in R (язык программирования)

Господа, а есть ли среди нас Rыцари moex? Есть пару вопросов по candle chart models.

источник

15:54пожаловаться #20