Size: a a a

R (язык программирования)

2021 February 25

AS

Alexander Semenov in R (язык программирования)
Igor Yegin
Не могу, коммерческая тайна.

Но нужно было найти в двух датасетах те бренды, для которых есть только одно unique значение производителя, далее сджоинить их по intersect брендов, и в конце концов вывести уникальные пары производителей
Недавно что-то похожее делал. В Excel долго тупил, написал на R. На утро сотрудница в Excel за 6 минут сделала, но тоже через VLOOKUP двух пивотов.
источник

IS

Ivan Struzhkov in R (язык программирования)
ну в общем звучит как несложная задача что там что там
источник

AS

Alexander Semenov in R (язык программирования)
План-капкан: сделать все 120 упражнений в sql-ex и потом в R данные только через sqldf ворочать.
источник

IY

Igor Yegin in R (язык программирования)
А sqldf на каком диалекте?
источник

AS

Alexander Semenov in R (язык программирования)
А бес его знает.
источник

AS

Alexander Semenov in R (язык программирования)
Я тут писал несколько раз о том, что слышал много лет назад утверждения о том, что это самый быстрый способ работать с данными в R. Хотя data.table() тогда уже существовал.
источник

AS

Alexander Semenov in R (язык программирования)
Но эта инфа из серии Рабинович напел.
источник

PU

Philipp Upravitelev in R (язык программирования)
последнее обновление в 17 году, забудь про него
источник

PU

Philipp Upravitelev in R (язык программирования)
он еще и с использованием proto написан
источник

PU

Philipp Upravitelev in R (язык программирования)
судя по странице в cran
источник

IS

Ivan Struzhkov in R (язык программирования)
если знаешь что хочешь получить - везде быстро
источник
2021 February 26

IS

Ivan Struzhkov in R (язык программирования)
но в экселе дольше и грязнее
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
последнее обновление в 17 году, забудь про него
Тот разговор был году в 15-м =). Или 2014-м. На первом Data Fest, короче.
источник

IS

Ivan Struzhkov in R (язык программирования)
но помимо того что очень туго там с абстракциями
источник

PU

Philipp Upravitelev in R (язык программирования)
Саша Шлемов поди песни пел, он любил его
источник

DK

Dm Kb in R (язык программирования)
Igor Yegin
Господа, требуется ваше мнение.

Есть ли какие-либо преимущества в обработке небольших датасетов (скажем, до 10 тыс. строк) через dplyr/data.table, а не через всякие примочки в Excel? Сегодня мой босс сделал сводными таблицами за минуту то, с чем я колупался час с лишним. У меня сложилось впечатление, что тот же data.table в такой ситуации — никому не нужный мозготрах, тормозящий рабочий процесс, а преимущество в скорости на таких массивах роли не играет
Я считаю, что весьма неплохо знаю excel. Во всяком случае как-то врукопашную там делал метод Ньютона))) в целом excel - это глючная и непрозрачная история... ну и для сводных таблиц используйте лучше rpivotTable - очень достойный пакет
источник

IY

Igor Yegin in R (язык программирования)
Dm Kb
Я считаю, что весьма неплохо знаю excel. Во всяком случае как-то врукопашную там делал метод Ньютона))) в целом excel - это глючная и непрозрачная история... ну и для сводных таблиц используйте лучше rpivotTable - очень достойный пакет
О, спасибо, даже не знал, что такое есть. Надо будет глянуть
источник

MM

Mikle Mikle in R (язык программирования)
Igor Yegin
Господа, требуется ваше мнение.

Есть ли какие-либо преимущества в обработке небольших датасетов (скажем, до 10 тыс. строк) через dplyr/data.table, а не через всякие примочки в Excel? Сегодня мой босс сделал сводными таблицами за минуту то, с чем я колупался час с лишним. У меня сложилось впечатление, что тот же data.table в такой ситуации — никому не нужный мозготрах, тормозящий рабочий процесс, а преимущество в скорости на таких массивах роли не играет
Похожий вопрос себе задавал в контексте SPSS и производства кучи больших таблиц с разнообразными срезами и стат тестами, да и ещё на взвешенных данных.
источник

MM

Mikle Mikle in R (язык программирования)
Пришёл к выводу, что тут R пока проседает. Но это, конечно, если есть доступ к дорогущему SPSS
источник

IY

Igor Yegin in R (язык программирования)
Mikle Mikle
Пришёл к выводу, что тут R пока проседает. Но это, конечно, если есть доступ к дорогущему SPSS
В одной из моих прошлых компаний использовали пиратский. 13 версии
источник