Size: a a a

R language and Statistical data analysis

2020 May 22

a

aGricolaMZ in R language and Statistical data analysis
Philipp Upravitelev
мне бы в идеале название/авторов/теги/рефренсы/аннотации
Мы недавно выкачивали из crosref, там есть API. И у нас есть какой-то 9Г дамп.
источник

R

Ross in R language and Statistical data analysis
Подскажите, проходил ли кто собес в ФБ на дата аналитика? И если да, какого уровня были вопросы по части кода sql & python/r?
источник

А

Александр in R language and Statistical data analysis
Philipp Upravitelev
друзья, к скопус или другим агрегаторам научной литературы (желательно по социальным наукам) через апи никто не стучался?
я вот вижу к гуглсколару апи, но вдруг у кого в опыте есть что-то подобное
Для апи архива есть обёртка на R в кране. Либа хорошо работает,тащит названия, аннотацию и все остальное. За выбранный промежуток времени и для конкретной темы тащит сразу пачку статей
источник

AM

Aleksei Morozov in R language and Statistical data analysis
Вдогонку к посту о кастомизации Rstudio. Недавно искал тему, чтобы она отвечала нескольким требованиям:
* выделение двупробельных отступов в начале строки (самое важное)
* тёмная
* подсветка выделенного слова в документе
* подсветка в Рмаркдауне
Если вы ищите нечто такое-же, то установите пакет rsthemes (он упоминается в посте Алексея) и выполните rsthemes::install_rsthemes(include_base16 = TRUE). появится куча тем, большинство из которых удовлетворяет таким условиям. да и светлые темы там очень даже ничего
https://github.com/gadenbuie/rsthemes
источник

PD

Pavel Demin in R language and Statistical data analysis
Aleksei Morozov
Вдогонку к посту о кастомизации Rstudio. Недавно искал тему, чтобы она отвечала нескольким требованиям:
* выделение двупробельных отступов в начале строки (самое важное)
* тёмная
* подсветка выделенного слова в документе
* подсветка в Рмаркдауне
Если вы ищите нечто такое-же, то установите пакет rsthemes (он упоминается в посте Алексея) и выполните rsthemes::install_rsthemes(include_base16 = TRUE). появится куча тем, большинство из которых удовлетворяет таким условиям. да и светлые темы там очень даже ничего
https://github.com/gadenbuie/rsthemes
Спасибо!
Опять потрачу половину рабочего дня на выбор темы по погоде и настроению))
источник

В

Виктория in R language and Statistical data analysis
всем привет) подскажите, каким способом можно добавить название столбца к значениям каждого столбца таблицы? Примерно так http://joxi.ru/Drlq1GDc0gnVDm
Наверное, как то через apply можно, но я не докрутила мысль.
источник

a

aGricolaMZ in R language and Statistical data analysis
Виктория
всем привет) подскажите, каким способом можно добавить название столбца к значениям каждого столбца таблицы? Примерно так http://joxi.ru/Drlq1GDc0gnVDm
Наверное, как то через apply можно, но я не докрутила мысль.
library(tidyverse)
mtcars %>%
 mutate(id = 1:n()) %>%
 pivot_longer(names_to = "cols", values_to = "values", mpg:carb) %>%
 mutate(new_values = str_c(cols, ".", values)) %>%
 select(-values) %>%
 pivot_wider(names_from = cols, values_from = new_values)
источник

YS

Yuriy Saraikin in R language and Statistical data analysis
Виктория
всем привет) подскажите, каким способом можно добавить название столбца к значениям каждого столбца таблицы? Примерно так http://joxi.ru/Drlq1GDc0gnVDm
Наверное, как то через apply можно, но я не докрутила мысль.
`apply(mtcars, 1, function(x) paste0(names(mtcars), x)) %>%
 t() %>%
 as.data.frame() %>%
 purrr::set_names(names(mtcars))`
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
aGricolaMZ
Мы недавно выкачивали из crosref, там есть API. И у нас есть какой-то 9Г дамп.
да мне со студентами поиграться с апи и httr
а что за crosref? я про них вроде слышал, но никогда не работал
источник

a

aGricolaMZ in R language and Statistical data analysis
Philipp Upravitelev
да мне со студентами поиграться с апи и httr
а что за crosref? я про них вроде слышал, но никогда не работал
Я, если честно, не знаю, мы со студенткой нашли, но разбиралась студентка
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
ага, спасибо
источник

a

aGricolaMZ in R language and Statistical data analysis
Виктория
всем привет) подскажите, каким способом можно добавить название столбца к значениям каждого столбца таблицы? Примерно так http://joxi.ru/Drlq1GDc0gnVDm
Наверное, как то через apply можно, но я не докрутила мысль.
вот еще вариант:

library(tidyverse)
map_dfr(1:nrow(mtcars), function(i){
 str_c( colnames(mtcars), ".", mtcars[i,]) %>%
   as_tibble_row(.name_repair = "unique")
}) ->
 df
colnames(df) <- colnames(mtcars)
df
источник

В

Виктория in R language and Statistical data analysis
Спасибо всем за ответы! Помогло)
источник

m

monagatep in R language and Statistical data analysis
Подскажите, а какие сейчас актуальные способы распаралленивания для caret под Windows?
Я попробовал стандартный doParallel ещё doSNOW, но все они дают небольшое ускорение, +10-15%.
При этом ядер 12, и все загружены очень-очень мало (то есть резерв для распараллеливания, вроде, есть)
источник

m

monagatep in R language and Statistical data analysis
А вообще, caret как набор всяких ML-библиотек ещё оправдан? Может, что-то лучше уже есть?
источник

AS

Alexander Semenov in R language and Statistical data analysis
Недавно обсуждали его неактуальность. mlr3, tidymodels, вот это всё сейчас посвежее.
источник

m

monagatep in R language and Statistical data analysis
Спасибо
источник

m

monagatep in R language and Statistical data analysis
А как у них с распараллеливанием? Они хорошо все ядра загружают?
источник

JS

Jury Sergeev in R language and Statistical data analysis
monagatep
Подскажите, а какие сейчас актуальные способы распаралленивания для caret под Windows?
Я попробовал стандартный doParallel ещё doSNOW, но все они дают небольшое ускорение, +10-15%.
При этом ядер 12, и все загружены очень-очень мало (то есть резерв для распараллеливания, вроде, есть)
эта тема непростая, может данных у Вас не так много, что бы получить какой-то значимый прирост, да и алгоритмы, что в R есть для ML - вполне себя сами параллелят
источник

AS

Alexander Semenov in R language and Statistical data analysis
Ну раз уж об этом заговорили, а разве в ML сейчас что-то кроме линейных моделей и бустинга используют? Второй сам неплохо параллелится.
источник