Size: a a a

R (язык программирования)

2020 October 27

PU

Philipp Upravitelev in R (язык программирования)
вот, тоже вариант, писать в атрибут миссинги
источник

АК

Артём Клевцов... in R (язык программирования)
Встречаем:
tidyfast: Fast Tidying of Data
Tidying functions built on 'data.table' to provide quick and efficient data manipulation with minimal overhead.
https://tysonbarrett.com/tidyfast/
Imports:   data.table (≥ 1.12.4), Rcpp
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Артём Клевцов
Встречаем:
tidyfast: Fast Tidying of Data
Tidying functions built on 'data.table' to provide quick and efficient data manipulation with minimal overhead.
https://tysonbarrett.com/tidyfast/
Imports:   data.table (≥ 1.12.4), Rcpp
А как же dtplyr.
источник

АК

Артём Клевцов... in R (язык программирования)
Евгений Томилов
А как же dtplyr.
Это другое. dtplyr - это обёртка для тех, кто по каким-то причинам не хочет или не может освоить синтаксис data.table.
Этот пакет (tidyfast) делает «привычные» для tidy-фанов вещи с использованием data.table/Rcpp с прицелом на максимизацию производительности.
источник

ЕТ

Евгений Томилов... in R (язык программирования)
Артём Клевцов
Это другое. dtplyr - это обёртка для тех, кто по каким-то причинам не хочет или не может освоить синтаксис data.table.
Этот пакет (tidyfast) делает «привычные» для tidy-фанов вещи с использованием data.table/Rcpp с прицелом на максимизацию производительности.
Круто!
источник

АК

Артём Клевцов... in R (язык программирования)
Артём Клевцов
Это другое. dtplyr - это обёртка для тех, кто по каким-то причинам не хочет или не может освоить синтаксис data.table.
Этот пакет (tidyfast) делает «привычные» для tidy-фанов вещи с использованием data.table/Rcpp с прицелом на максимизацию производительности.
В данный момент нативно (data.table) эти вещи делаются нетривиально и не все могут додуматься или догуглиться до них.
источник

AS

Alexander Semenov in R (язык программирования)
Артём Клевцов
Это другое. dtplyr - это обёртка для тех, кто по каким-то причинам не хочет или не может освоить синтаксис data.table.
Этот пакет (tidyfast) делает «привычные» для tidy-фанов вещи с использованием data.table/Rcpp с прицелом на максимизацию производительности.
Сходу по этому комменту не смог уловить разницу.
источник

a

aGricolaMZ in R (язык программирования)
Alexander Semenov
Сходу по этому комменту не смог уловить разницу.
ну есть же разница, когда запускаешь R из Python и Python из R
источник

АК

Артём Клевцов... in R (язык программирования)
aGricolaMZ
ну есть же разница, когда запускаешь R из Python и Python из R
Не для всех 😁
источник

AS

Alexander Semenov in R (язык программирования)
Евгений Томилов
А как же dtplyr.
Там написано, что это поделие его дополняет.
источник

PU

Philipp Upravitelev in R (язык программирования)
не, я не понимаю этот мир
ну зачем dt_case_when() for dplyr::case_when(), когда есть fcase с аналогичным синтаксисом
dt_pivot_wider() вообще смешно. сначала gather заменили на pivot_wider(), по легкой аналогии с dcast, потом сделали аналог аналога.
источник

AS

Alexander Semenov in R (язык программирования)
Луше расскажи мне, что приключилось со старой доброй sample_n()?
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
Сходу по этому комменту не смог уловить разницу.
tidyfast - использование tidy-синтаксиса над data.table-таблицами
dtplyr - использование скорости и движка data.table в скрытом виде, обернув в tidy-синтаксис и над tibble-таблицами
источник

AS

Alexander Semenov in R (язык программирования)
Хотел catboostнуть перед сном, но Гадли опять что-то поломал =(
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
Луше расскажи мне, что приключилось со старой доброй sample_n()?
а что не так? вроде отдает по одной строке каждой группы, норм же?
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
а что не так? вроде отдает по одной строке каждой группы, норм же?
Ну тут хоть что-то отдаёт. В рабочем примере так и вовсе сплошными ошибками кормит.
источник

PU

Philipp Upravitelev in R (язык программирования)
ну, может у тебя там данные кривые, смотреть надо
*вообще, зачем ты работаешь на ночь, сон плохой же будет %))))
источник

AS

Alexander Semenov in R (язык программирования)
Philipp Upravitelev
ну, может у тебя там данные кривые, смотреть надо
*вообще, зачем ты работаешь на ночь, сон плохой же будет %))))
Потому, что в рабочее время мне приходится объяснять людям, почему мне нужен SQL,  а не очередной бесполезный дашборд и выполнять работу за недобросовестными подчинёнными.
источник

ИП

Иван Поздняков... in R (язык программирования)
Philipp Upravitelev
не, я не понимаю этот мир
ну зачем dt_case_when() for dplyr::case_when(), когда есть fcase с аналогичным синтаксисом
dt_pivot_wider() вообще смешно. сначала gather заменили на pivot_wider(), по легкой аналогии с dcast, потом сделали аналог аналога.
reshape(2)::melt/dcast -> tidyr(old)::gather/spread -> tidyr(new)::pivot_wider/pivot_longer. Честно говоря, появление pivot_wider как раз стало поводом для меня освоить нормально тайдиверс, ибо я никак не мог запомнить, когда мне нужен melt, а когда dcast. Gather и spread уже лучше, но pivot_wider() и pivot_longer() - это суперпонятно и очевидно. Да и их синтаксис интуитивен, запоминается с первого раза
источник

AS

Alexander Semenov in R (язык программирования)
Иван Поздняков
reshape(2)::melt/dcast -> tidyr(old)::gather/spread -> tidyr(new)::pivot_wider/pivot_longer. Честно говоря, появление pivot_wider как раз стало поводом для меня освоить нормально тайдиверс, ибо я никак не мог запомнить, когда мне нужен melt, а когда dcast. Gather и spread уже лучше, но pivot_wider() и pivot_longer() - это суперпонятно и очевидно. Да и их синтаксис интуитивен, запоминается с первого раза
+100
Я тут уже как-то писал, что все эти cast/melt/gather/spread мне приходилось постоянно гуглить. А вот pivot_wider()/pivot_longer() я с первого раза написал по памяти. После этого пользуюсь только им.
источник