Size: a a a

R language and Statistical data analysis

2019 October 21

А

Александр in R language and Statistical data analysis
Артём Клевцов
Как компилил и на чём? Что-то с OpenMP может быть.
не помню что бы я  c gforce отдельно возился, веротяно он сам встал по дефлоту, а так машина с Ubuntu 18.04.3 LTS (GNU/Linux 4.15.0-62-generic x86_64)
источник

АК

Артём Клевцов in R language and Statistical data analysis
Так же агрегацию можно по одной за раз считать, если это всё спрятано в коде.
источник

А

Александр in R language and Statistical data analysis
Артём Клевцов
Так же агрегацию можно по одной за раз считать, если это всё спрятано в коде.
потом мержить все агрегированные таблички?
источник

АК

Артём Клевцов in R language and Statistical data analysis
Сделай обычный вызов dt[, .(v = mean(col)), verbose = TRUE].
источник

АК

Артём Клевцов in R language and Statistical data analysis
> DT[, .(v = mean(V1)), by = id, verbose = TRUE]
Detected that j uses these columns: V1
Finding groups using forderv ... forder.c received 5000000 rows and 1 columns
0.102s elapsed (0.186s cpu)
Finding group sizes from the positions (can be avoided to save RAM) ... 0.001s elapsed (0.001s cpu)
Getting back original order ... forder.c received a vector type 'integer' length 100000
0.005s elapsed (0.008s cpu)
lapply optimization is on, j unchanged as 'list(mean(V1))'
GForce optimized j to 'list(gmean(V1))'
Making each group and running j (GForce TRUE) ... gforce initial population of grp took 0.062
gforce assign high and low took 0.036
This gsum took (narm=FALSE) ... gather took ... 0.010s
0.021s
gforce eval took 0.021
0.121s elapsed (0.200s cpu)
источник

А

Александр in R language and Statistical data analysis
Артём Клевцов
Сделай обычный вызов dt[, .(v = mean(col)), verbose = TRUE].
u = dt.io[,.(mean_next_fee = mean(next_fee,na.rm = T)),by = tid, verbose = TRUE]

Detected that j uses these columns: next_fee
Finding groups using forderv ... forder.c received 195938767 rows and 1 columns
1.527s elapsed (18.1s cpu)
Finding group sizes from the positions (can be avoided to save RAM) ... 0.122s elapsed (0.115s cpu)
Getting back original order ... forder.c received a vector type 'integer' length 22317775
0.836s elapsed (4.690s cpu)
lapply optimization is on, j unchanged as 'list(mean(next_fee, na.rm = T))'
GForce optimized j to 'list(gmean(next_fee, na.rm = TRUE))'
Making each group and running j (GForce TRUE) ... gforce initial population of grp took 0.125
gforce assign high and low took 0.357
gforce eval took 2.242
3.086s elapsed (7.874s cpu)
источник

АК

Артём Клевцов in R language and Statistical data analysis
Тут норм всё.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Значит OpenMP работает и функции подменяются на GForce.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Теепрь надо чуть усложнить.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Задачи найти, что именно отключает оптимизацию.
источник

А

Александр in R language and Statistical data analysis
Артём Клевцов
Теепрь надо чуть усложнить.
u = dt.io[,.(mean_next_fee = mean(next_fee,na.rm = T),
            mode_next_fee = DescTools::Mode(next_fee,na.rm = T)[1]),by = tid, verbose = TRUE]

Detected that j uses these columns: next_fee
Finding groups using forderv ... forder.c received 195938767 rows and 1 columns
1.553s elapsed (18.5s cpu)
Finding group sizes from the positions (can be avoided to save RAM) ... 0.122s elapsed (0.099s cpu)
Getting back original order ... forder.c received a vector type 'integer' length 22317775
0.816s elapsed (4.714s cpu)
lapply optimization is on, j unchanged as 'list(mean(next_fee, na.rm = T), Mode(next_fee, na.rm = T)[1])'
GForce is on, left j unchanged
Old mean optimization changed j from 'list(mean(next_fee, na.rm = T), Mode(next_fee, na.rm = T)[1])' to 'list(.External(Cfastmean, next_fee, T), Mode(next_fee, na.rm = T)[1])'
Making each group and running j (GForce FALSE) ...
источник

А

Александр in R language and Statistical data analysis
кажется из-за DescTools
источник

АК

Артём Клевцов in R language and Statistical data analysis
Можно его потом отдельно посчитать или найти позабористее вариант.
Посмотри пакет matrixStats.
Саму моду можно и нативным data.table посчитать.
источник

А

Александр in R language and Statistical data analysis
Артём Клевцов
Можно его потом отдельно посчитать или найти позабористее вариант.
Посмотри пакет matrixStats.
Саму моду можно и нативным data.table посчитать.
интересный пакет, спасибо
источник

АК

Артём Клевцов in R language and Statistical data analysis
Как минимум сейчас стоит разделить расчёт GForce и всего остального.
источник

А

Александр in R language and Statistical data analysis
Артём Клевцов
Как минимум сейчас стоит разделить расчёт GForce и всего остального.
ага, так и сделаю
источник
2019 October 22

C

Cocos in R language and Statistical data analysis
как вывести на график не кружочками , а точками?
источник

a

aGricolaMZ in R language and Statistical data analysis
а вы можете привести гугл запрос, которым Вы искали в гугле?
источник

a

aGricolaMZ in R language and Statistical data analysis
А то, согласно првавилам чата, нужно сначала гуглить
источник

C

Cocos in R language and Statistical data analysis
нашёл
источник