Телеграмм чат группы rlang

> DT[, .(v = mean(V1)), by = id, verbose = TRUE]
Detected that j uses these columns: V1 
Finding groups using forderv ... forder.c received 5000000 rows and 1 columns
0.102s elapsed (0.186s cpu) 
Finding group sizes from the positions (can be avoided to save RAM) ... 0.001s elapsed (0.001s cpu) 
Getting back original order ... forder.c received a vector type 'integer' length 100000
0.005s elapsed (0.008s cpu) 
lapply optimization is on, j unchanged as 'list(mean(V1))'
GForce optimized j to 'list(gmean(V1))'
Making each group and running j (GForce TRUE) ... gforce initial population of grp took 0.062
gforce assign high and low took 0.036
This gsum took (narm=FALSE) ... gather took ... 0.010s
0.021s
gforce eval took 0.021
0.121s elapsed (0.200s cpu)

источник

17:36пожаловаться #5

Александр in R language and Statistical data analysis

Артём Клевцов

Сделай обычный вызов dt[, .(v = mean(col)), verbose = TRUE].

u = dt.io[,.(mean_next_fee = mean(next_fee,na.rm = T)),by = tid, verbose = TRUE]

Detected that j uses these columns: next_fee
Finding groups using forderv ... forder.c received 195938767 rows and 1 columns
1.527s elapsed (18.1s cpu)
Finding group sizes from the positions (can be avoided to save RAM) ... 0.122s elapsed (0.115s cpu)
Getting back original order ... forder.c received a vector type 'integer' length 22317775
0.836s elapsed (4.690s cpu)
lapply optimization is on, j unchanged as 'list(mean(next_fee, na.rm = T))'
GForce optimized j to 'list(gmean(next_fee, na.rm = TRUE))'
Making each group and running j (GForce TRUE) ... gforce initial population of grp took 0.125
gforce assign high and low took 0.357
gforce eval took 2.242
3.086s elapsed (7.874s cpu)

источник

17:36пожаловаться #6

АК

Артём Клевцов in R language and Statistical data analysis

Тут норм всё.

источник

17:36пожаловаться #7

АК

Артём Клевцов in R language and Statistical data analysis

Значит OpenMP работает и функции подменяются на GForce.

источник

17:37пожаловаться #8

АК

Артём Клевцов in R language and Statistical data analysis

Теепрь надо чуть усложнить.

источник

17:37пожаловаться #9

АК

Артём Клевцов in R language and Statistical data analysis

Задачи найти, что именно отключает оптимизацию.

источник

17:38пожаловаться #10

Александр in R language and Statistical data analysis

Артём Клевцов

Теепрь надо чуть усложнить.

u = dt.io[,.(mean_next_fee = mean(next_fee,na.rm = T),
mode_next_fee = DescTools::Mode(next_fee,na.rm = T)[1]),by = tid, verbose = TRUE]

Detected that j uses these columns: next_fee
Finding groups using forderv ... forder.c received 195938767 rows and 1 columns
1.553s elapsed (18.5s cpu)
Finding group sizes from the positions (can be avoided to save RAM) ... 0.122s elapsed (0.099s cpu)
Getting back original order ... forder.c received a vector type 'integer' length 22317775
0.816s elapsed (4.714s cpu)
lapply optimization is on, j unchanged as 'list(mean(next_fee, na.rm = T), Mode(next_fee, na.rm = T)[1])'
GForce is on, left j unchanged
Old mean optimization changed j from 'list(mean(next_fee, na.rm = T), Mode(next_fee, na.rm = T)[1])' to 'list(.External(Cfastmean, next_fee, T), Mode(next_fee, na.rm = T)[1])'
Making each group and running j (GForce FALSE) ...

источник

17:39пожаловаться #11

Александр in R language and Statistical data analysis

кажется из-за DescTools

источник

17:39пожаловаться #12

АК

Артём Клевцов in R language and Statistical data analysis

Можно его потом отдельно посчитать или найти позабористее вариант.
Посмотри пакет matrixStats.
Саму моду можно и нативным data.table посчитать.

источник

17:41пожаловаться #13

Александр in R language and Statistical data analysis