Size: a a a

R (язык программирования)

2020 August 07

AB

Alexey Burnakov in R (язык программирования)
Вдруг пригодиться )
источник

АК

Артём Клевцов... in R (язык программирования)
Ivan Struzhkov
всем привет!
столкнулся с тем что скорость работы
doc1[1:nrow(doc1),list(list_col=as.character(unlist(list_col))),by=list(attempt_id)]->doc2

на порядок выше чем
doc1[,list(list_col=as.character(unlist(list_col))),by=list(attempt_id)]->doc2


есть ли этому объяснение?
В каком месте оно на порядок быстрее?
bench::mark(
 v1 = doc1[1:nrow(doc1),list(list_col=as.character(unlist(list_col))),by=list(attempt_id)],
 v2 = doc1[,list(list_col=as.character(unlist(list_col))),by=list(attempt_id)],
 min_iterations = 100
)
Результат:
  expression   min median `itr/sec` mem_alloc `gc/sec` n_itr  n_gc
 <bch:expr> <bch> <bch:>     <dbl> <bch:byt>    <dbl> <int> <dbl>
1 v1         332ms  358ms      2.67        NA     6.51   100   244
2 v2         325ms  348ms      2.74        NA     6.66   100   243
источник

АК

Артём Клевцов... in R (язык программирования)
Артём Клевцов
В каком месте оно на порядок быстрее?
bench::mark(
 v1 = doc1[1:nrow(doc1),list(list_col=as.character(unlist(list_col))),by=list(attempt_id)],
 v2 = doc1[,list(list_col=as.character(unlist(list_col))),by=list(attempt_id)],
 min_iterations = 100
)
Результат:
  expression   min median `itr/sec` mem_alloc `gc/sec` n_itr  n_gc
 <bch:expr> <bch> <bch:>     <dbl> <bch:byt>    <dbl> <int> <dbl>
1 v1         332ms  358ms      2.67        NA     6.51   100   244
2 v2         325ms  348ms      2.74        NA     6.66   100   243
Если хочется понимать, что происходит под капотом data.table включаем опцию verbose.
источник

IS

Ivan Struzhkov in R (язык программирования)
Артём Клевцов
В каком месте оно на порядок быстрее?
bench::mark(
 v1 = doc1[1:nrow(doc1),list(list_col=as.character(unlist(list_col))),by=list(attempt_id)],
 v2 = doc1[,list(list_col=as.character(unlist(list_col))),by=list(attempt_id)],
 min_iterations = 100
)
Результат:
  expression   min median `itr/sec` mem_alloc `gc/sec` n_itr  n_gc
 <bch:expr> <bch> <bch:>     <dbl> <bch:byt>    <dbl> <int> <dbl>
1 v1         332ms  358ms      2.67        NA     6.51   100   244
2 v2         325ms  348ms      2.74        NA     6.66   100   243
странно в результаты в своей среде  я показывал выше
источник

АК

Артём Клевцов... in R (язык программирования)
Ivan Struzhkov
странно в результаты в своей среде  я показывал выше
Категорически не понятно, что ты там в своей среде намерил, т.к. есть ряд нюансов при измерении производительности data.table. Среди прочего стоит отметить имплицитное построение индексов при первом обращении к столбцу. Есть и другие нюансы.
источник

AS

Alexander Semenov in R (язык программирования)
Inip Tyig
Вот вам пятничная новость: ученые переименовали за 2020 целых 27 цепочек в днк. Основная причина: Microsoft Excel на старых названиях думал что это даты :) Типичный пример - MARCH1 (membrane associated ring-CH-Type finger 1), который при вставке в эксель конвертировался в 1-Mar-2020.

Да, ученые всего мира много работают с экселем и такое название - реальная проблема. Удивительны пример правильной гибкости научного мира https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates?scrolla=5eb6d68b7fedc32c19ef33b4
Спасибо за ссылку!  Как раз опять в отчёте на пару миллионов промахнулись. Буду знать, на кого валить.
источник

A

Aleksandr in R (язык программирования)
Коллеги, подскажите какой функцией вернуть строку без кавычек? Хочу в .rmd вставить ссылки на картинки, а он отказывается есть имя заданное
file <- "image.png"
источник

a

aGricolaMZ in R (язык программирования)
А как Вы пытаетесь их вывести?
источник

A

Aleksandr in R (язык программирования)
![](file)
источник

a

aGricolaMZ in R (язык программирования)
Попробуйте knitr::include_graphics()
источник

A

Aleksandr in R (язык программирования)
спасибо, почти работает, сейчас трабл с кодировкой, но это я решу ))
источник

A

Aleksandr in R (язык программирования)
Погорячился, не могу заставить его съесть русские символы run current chunk работает, а нажатие кнопки Knit приводит к ошибке
источник

a

aGricolaMZ in R (язык программирования)
О боже, это кодировка... Поменяйте локале на ваш ср12что-то там
источник

АН

Алексей Нагорский... in R (язык программирования)
1251
источник

A

Aleksandr in R (язык программирования)
Sys.getlocale()
[1] "LC_COLLATE=Russian_Russia.1251;LC_CTYPE=Russian_Russia.1251;LC_MONETARY=Russian_Russia.1251;LC_NUMERIC=C;LC_TIME=Russian_Russia.1251"
источник

АК

Артём Клевцов... in R (язык программирования)
Aleksandr
Sys.getlocale()
[1] "LC_COLLATE=Russian_Russia.1251;LC_CTYPE=Russian_Russia.1251;LC_MONETARY=Russian_Russia.1251;LC_NUMERIC=C;LC_TIME=Russian_Russia.1251"
Файл.
источник

A

Aleksandr in R (язык программирования)
Файл с кодировкой CP1251
источник

A

Aleksandr in R (язык программирования)
Quitting from lines 8-9 (pervichka.Rmd)
Ошибка в knitr::include_graphics("10-22-18_Experiment_[187.2-307.2] <f0><f3><f1><f1><ea><e8><e5> <f1><e8><ec><e2><ee><eb><fb>.png") :
 Cannot find the file(s): "10-22-18_Experiment_[187.2-307.2] <f0><f3><f1><f1><ea><e8><e5> <f1><e8><ec><e2><ee><eb><fb>.png"
Вызовы: <Anonymous> ... withCallingHandlers -> withVisible -> eval -> eval -> <Anonymous>
Вдобавок: Предупреждения:
1: В readLines(con, warn = FALSE) :
 неправильный ввод найден во входном соединении 'pervichka.Rmd'
2: В knitr::knit(knit_input, knit_output, envir = envir, quiet = quiet) :
 The file "pervichka.Rmd" must be encoded in UTF-8. Please see https://yihui.org/en/2018/11/biggest-regret-knitr/ for more info.
Выполнение остановлено
источник

A

Aleksandr in R (язык программирования)
При перекодировке файла в UTF-8 возвращаемся в пункт со скрином выше
источник

A

Aleksandr in R (язык программирования)
Sys.setlocale("LC_ALL", "UTF-8")
[1] ""
Предупреждение:
В Sys.setlocale("LC_ALL", "UTF-8") :
 ОС сообщает, что запрос установки локали в "UTF-8" не может быть выполнен
источник