SG
подскажите как из R вызвать через командную строку внешнюю программу (*.jar) с некоторым входным параметром
Size: a a a
SG
АК
AK
PU
JS
cut
, awk
и всякие csvkit
использовать чтобы просто прочитать часть столбцов из большого файла.SG
АК
АК
JS
JS
UT
IT
IT
fj
UT
A
disk.frame
-а занимает порядка 1.5 ч. ОЗУ расходуется вся, но ничего не виснет и не падает. Это все с backend = "data.table"
и chunk_reader = "bigreadr"
. Такой вариант вроде бы должен быть самым быстрым, дополнительно ускориться теоретически можно путем использования более скоростных SSD, разместив исходник и итоговую папку на разных дисках.TMPDIR
(например, в .Renviron
)..fst
-файлами, и примерно 200 Гб во время работы ушло под временные файлы. Из этих 200 Гб во временной папке было видно половину, и еще 100 Гб болтались непонятно где, видимо в виде скрытых файлов каких-то.backend = "LaF"
.ГД
disk.frame
-а занимает порядка 1.5 ч. ОЗУ расходуется вся, но ничего не виснет и не падает. Это все с backend = "data.table"
и chunk_reader = "bigreadr"
. Такой вариант вроде бы должен быть самым быстрым, дополнительно ускориться теоретически можно путем использования более скоростных SSD, разместив исходник и итоговую папку на разных дисках.TMPDIR
(например, в .Renviron
)..fst
-файлами, и примерно 200 Гб во время работы ушло под временные файлы. Из этих 200 Гб во временной папке было видно половину, и еще 100 Гб болтались непонятно где, видимо в виде скрытых файлов каких-то.backend = "LaF"
.A
A
using the 'LaF' package.
то же самое можно использовать в disk.frame
. Но будет работать медленнее, потому что в 1 поток