Size: a a a

R (язык программирования)

2020 July 04

ЕТ

Евгений Томилов... in R (язык программирования)
Юрий 🐙💻🤖📊📈🚬
Лучшее решение никогда на Винде10 не использовать в пути проекта кириллицу
Угу... Я уже перепилил всё. Но очень загадочно, ПОЧЕМУ так. Каков механизм такого бага.
источник
2020 July 05

AK

Alexandr Klimov in R (язык программирования)
Добрый день!
Помогите, плиз, решить задачку:

Есть столбец table$skills, где категории в разном порядке и количестве записаны текстом. Всего вариантов скилов около 100.

Как написать такой код, который добавит к исходной таблице table 100 новых столбцов-скиллов и проставит 1, если это значение есть в в table$skills?
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexandr Klimov
Добрый день!
Помогите, плиз, решить задачку:

Есть столбец table$skills, где категории в разном порядке и количестве записаны текстом. Всего вариантов скилов около 100.

Как написать такой код, который добавит к исходной таблице table 100 новых столбцов-скиллов и проставит 1, если это значение есть в в table$skills?
чот типа такого
library(data.table)

dt1 <- data.table(
 var1 = c('читать, рисовать', 'читать', 'рисовать')
)
dt1[, index := 1:.N]

dt1_long <- dt1[, list(skill = unlist(strsplit(var1, ', '))), by = index]
dt1_wide <- dcast(dt1_long, index ~ skill, fun.aggregate = length, fill = 0)
dt1 <- merge(dt1, dt1_wide, by = 'index', all.x = TRUE)
источник

AK

Alexandr Klimov in R (язык программирования)
Philipp Upravitelev
чот типа такого
library(data.table)

dt1 <- data.table(
 var1 = c('читать, рисовать', 'читать', 'рисовать')
)
dt1[, index := 1:.N]

dt1_long <- dt1[, list(skill = unlist(strsplit(var1, ', '))), by = index]
dt1_wide <- dcast(dt1_long, index ~ skill, fun.aggregate = length, fill = 0)
dt1 <- merge(dt1, dt1_wide, by = 'index', all.x = TRUE)
Работает! Но есть нюанс: в таком случае алгоритм останавливается на первом вхождение слова (категории скилла), а нужно чтобы записывались все. Т.е. сейчас сумма по всем появившимся столбцам скиллов будет = 1. А должна быть равна к-в вхождений. Как "счетесли" в excel.

Еще не отметил, что хочется привязку к ID строчек в table$skills сохранить. Чтобы скилы отмечались единичками у соответствующих людей в таблице table, а не в отдельной.

По-идее эту задачку можно циклом решить, но не понимаю, как его прописать.
Физическая логика следующая:  Берем первый скилл из вектора-справочника, создаем доп столбец в исходной табличке table (например table$Рисовать), идем смотреть где есть вхождение слова "Рисовать" в тексте table$skills, ставим единичку в table$Рисовать. И так по всем скиллам
источник

PU

Philipp Upravitelev in R (язык программирования)
сумма по строке должна быть равна количеству вхождений
а вместо index вполне можно использовать идентификатор наблюдения
источник

AK

Alexandr Klimov in R (язык программирования)
Philipp Upravitelev
сумма по строке должна быть равна количеству вхождений
а вместо index вполне можно использовать идентификатор наблюдения
Спасибо! На свежую голову получилось
🙏
источник

PU

Philipp Upravitelev in R (язык программирования)
👍
источник

PD

Pavel Demin in R (язык программирования)
Друзья, всем привет!
я в очередной раз листал rpubs.com, увидел интересный пост:
https://rpubs.com/czang97/UVA-DSPG-OSS

дело в том, что там в конце карта - она, конечно, глючная, но там есть функционал, который меня жутко заинтересовал. если нажать на точку на карте, то осуществляется геокодинг - сверху появляется атрибут из ОСМ display name.
кто-нибудь знает, как это делается? или автор просто добавил JS код туда?
источник

PD

Pavel Demin in R (язык программирования)
и вообще, я же правильно понимаю, что если автор не опубликовал код в своем файле, то нет возможности его посмотреть?
источник

IT

Inip Tyig in R (язык программирования)
консоль разработчика в любом браузере должна помочь вам
источник

АК

Артём Клевцов... in R (язык программирования)
Pavel Demin
и вообще, я же правильно понимаю, что если автор не опубликовал код в своем файле, то нет возможности его посмотреть?
Это вроде бы стандартный функционал leaflet. Можно добавить текст, который будет показан при наведении и при клике.
источник

АК

Артём Клевцов... in R (язык программирования)
Артём Клевцов
Это вроде бы стандартный функционал leaflet. Можно добавить текст, который будет показан при наведении и при клике.
Ссылку на документацию: https://rstudio.github.io/leaflet/popups.html
источник

E

EK479 in R (язык программирования)
Здравствуйте! У меня есть данные из меню масдональдса. Там блюда разбиты на категории. Я хочу сравнить категории и определить, как в среднем различаются калорийность, содержание жиров и другие параметры в зависимости от категории.
1) Является ли проблемой для выполнения этой задачи то, что категории содержат разное количество блюд?
2) Я сравниваю категории, запуская Kruskal-Wallis test. Но этот тест просто показывает то, что есть статистически значимая разница между группами. Далее я запускаю Wilcoxon test pairwise.wilcox.test(df$Calories, df$Category, p.adjust.method = "BH", exact=F, correct=F). Этот тест показывает между какими именно группами есть статистическая разница в калорийности.
Скажите, я правильно делаю, используя эти тесты и в такой последовательности?
источник

PD

Pavel Demin in R (язык программирования)
Артём Клевцов
Это вроде бы стандартный функционал leaflet. Можно добавить текст, который будет показан при наведении и при клике.
я лифлетом в R пользуюсь довольно часто, не встречал такого. я же не про лейблы и попапы простые говорю. если есть минута, посмотрите на сайте, про что я написал. скриншот прилагаю
источник

PD

Pavel Demin in R (язык программирования)
источник

PD

Pavel Demin in R (язык программирования)
Inip Tyig
консоль разработчика в любом браузере должна помочь вам
посмотрел, и как ни странно - понял.
в либе leaflet.extras есть функция “addReverseSearchOSM”. Не знаю, как я ее сразу не заметил…
источник

АК

Артём Клевцов... in R (язык программирования)
Pavel Demin
я лифлетом в R пользуюсь довольно часто, не встречал такого. я же не про лейблы и попапы простые говорю. если есть минута, посмотрите на сайте, про что я написал. скриншот прилагаю
Не сразу понял о чём речь. Это реверсивный геокодинг. Есть плагин отдельный для этого.
источник

А[

Александр [capsula]... in R (язык программирования)
EK479
Здравствуйте! У меня есть данные из меню масдональдса. Там блюда разбиты на категории. Я хочу сравнить категории и определить, как в среднем различаются калорийность, содержание жиров и другие параметры в зависимости от категории.
1) Является ли проблемой для выполнения этой задачи то, что категории содержат разное количество блюд?
2) Я сравниваю категории, запуская Kruskal-Wallis test. Но этот тест просто показывает то, что есть статистически значимая разница между группами. Далее я запускаю Wilcoxon test pairwise.wilcox.test(df$Calories, df$Category, p.adjust.method = "BH", exact=F, correct=F). Этот тест показывает между какими именно группами есть статистическая разница в калорийности.
Скажите, я правильно делаю, используя эти тесты и в такой последовательности?
1. Зависит от постановки задачи. Если вы смотрите разницу в категориях, все ок, если хотите найти разницу по калоражу в среднем - выведите не сумму, а среднее
2. Для постхока я бы рекомендовал критерий Данна из пакета FSA
источник

E

EK479 in R (язык программирования)
Александр [capsula]
1. Зависит от постановки задачи. Если вы смотрите разницу в категориях, все ок, если хотите найти разницу по калоражу в среднем - выведите не сумму, а среднее
2. Для постхока я бы рекомендовал критерий Данна из пакета FSA
Спасибо!
источник

БА

Байкулов Антон... in R (язык программирования)
Господа, а есть ли среди нас Rыцари moex? Есть пару вопросов по candle chart models.
источник