Size: a a a

R (язык программирования)

2020 August 06

ЕБ

Евгений Балакловский... in R (язык программирования)
примерно понял, чтото такое требуется st_polygon(list(rbind(c(0,0), c(2,0), c(2,2), c(0,2), c(0,0))))

а как долго st_cointans считался? у меня чуть меньше 10к строк
источник

PD

Pavel Demin in R (язык программирования)
боюсь, сейчас уже не подскажу. было давно, и вполне вероятно, я что-то криво написал, потому и считалось долго
источник

АК

Артём Клевцов... in R (язык программирования)
Ivan Struzhkov
read_csv("https://github.com/jordiclive/Revolut_KYC_Exercise/raw/master/data/doc_reports.csv")->doc
doc %>% mutate(list_col=str_split(properties,','))->doc1
doc1[1:nrow(doc1),list(list_col=as.character(unlist(list_col))),by=list(attempt_id)]->doc2
Думаю, не нужно так издеваться над данными и языком.
# Загружаем пакеты
library(data.table)
library(curl)
library(jsonlite)

# URL с датасетом
u <- "https://github.com/jordiclive/Revolut_KYC_Exercise/raw/master/data/doc_reports.csv"
# Считываем данные
.dt <- fread(u)
# Фиксим JSON
.dt[, properties := gsub("'", "\"", properties, fixed = TRUE)]
.dt[, properties := gsub("None", "null", properties, fixed = TRUE)]
# Парсим JSON
props <- fromJSON(paste0("[", paste0(.dt$properties, collapse = ","), "]"))
# Постобработка
setDT(props)
props[, date_of_expiry := as.Date(date_of_expiry)]
# Удаляем лишние столбцы
.dt[, properties := NULL]
# Объединяем данные
.dt <- cbind(.dt, props)
str(.dt)
источник

IS

Ivan Struzhkov in R (язык программирования)
Артём Клевцов
Думаю, не нужно так издеваться над данными и языком.
# Загружаем пакеты
library(data.table)
library(curl)
library(jsonlite)

# URL с датасетом
u <- "https://github.com/jordiclive/Revolut_KYC_Exercise/raw/master/data/doc_reports.csv"
# Считываем данные
.dt <- fread(u)
# Фиксим JSON
.dt[, properties := gsub("'", "\"", properties, fixed = TRUE)]
.dt[, properties := gsub("None", "null", properties, fixed = TRUE)]
# Парсим JSON
props <- fromJSON(paste0("[", paste0(.dt$properties, collapse = ","), "]"))
# Постобработка
setDT(props)
props[, date_of_expiry := as.Date(date_of_expiry)]
# Удаляем лишние столбцы
.dt[, properties := NULL]
# Объединяем данные
.dt <- cbind(.dt, props)
str(.dt)
Спасибо за пример! у меня что то сходу fromJSON вчера ругнулся - я и накостылял
источник
2020 August 07

PU

Philipp Upravitelev in R (язык программирования)
источник

В

Виктор in R (язык программирования)
омг
раскрыли тайну ее нарядов лоол
источник

В

Виктор in R (язык программирования)
есть такая же про киркора филипова
источник

IT

Inip Tyig in R (язык программирования)
да что ж не так с этим экселем (:
источник

IT

Inip Tyig in R (язык программирования)
Вот вам пятничная новость: ученые переименовали за 2020 целых 27 цепочек в днк. Основная причина: Microsoft Excel на старых названиях думал что это даты :) Типичный пример - MARCH1 (membrane associated ring-CH-Type finger 1), который при вставке в эксель конвертировался в 1-Mar-2020.

Да, ученые всего мира много работают с экселем и такое название - реальная проблема. Удивительны пример правильной гибкости научного мира https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates?scrolla=5eb6d68b7fedc32c19ef33b4
источник

IT

Inip Tyig in R (язык программирования)
интересно, для совместимости с R шли на подобные уступки когда-нибудь
источник

А[

Александр [capsula]... in R (язык программирования)
Inip Tyig
Вот вам пятничная новость: ученые переименовали за 2020 целых 27 цепочек в днк. Основная причина: Microsoft Excel на старых названиях думал что это даты :) Типичный пример - MARCH1 (membrane associated ring-CH-Type finger 1), который при вставке в эксель конвертировался в 1-Mar-2020.

Да, ученые всего мира много работают с экселем и такое название - реальная проблема. Удивительны пример правильной гибкости научного мира https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-dates?scrolla=5eb6d68b7fedc32c19ef33b4
А формат ячейки поменять нельзя было? Ну или картинкой бы вставили, как дети, ей богу
источник

IT

Inip Tyig in R (язык программирования)
да, формат — здорово, конеечно, но вот не уверен, что при переносе между экселями на разных машинах, или того хуже, версиях, понимание того, что с этим форматомо можно делать, сильно неуйтойчиво. И от коллег послле правки может вернуться груда фарша вместо данных
источник

В

Виктор in R (язык программирования)
Александр [capsula]
А формат ячейки поменять нельзя было? Ну или картинкой бы вставили, как дети, ей богу
очевидно - это юмор, ибо "картинка" эт лол
источник

AK

Alexey Khavylo in R (язык программирования)
Да, друзья биологи матерились на это постоянно. У самого много раз были проблемы, когда Эксель считал, что он самый умный и неожиданно выборочно конвертировал значения ячеек
источник

А[

Александр [capsula]... in R (язык программирования)
Виктор
очевидно - это юмор, ибо "картинка" эт лол
Эх, если бы лол, это низкая компьютерная грамотность...
Как-то нужно было лаборанту перенести список сотрудников из ворда, в эксель. Копировать не получалось массивом - там тяжёлая история, перенести нужно было с пк1 на пк2, сети между ними не было - а сделать нужно было быстро. Вручную тоже писать не вариант, 21 век все же. Поэтому на пк1 сделали скриншот с ворда, слили на телефон, залили на пк2 в эксель, профит. Чтобы избежать оффтопа, замечу, что ни один из R-пользователей не пострадал
источник

AB

Alexey Burnakov in R (язык программирования)
Как уверенный пользователь ПК, в бытность аналитики на экселе столкнулся с тем, что мне прислали выгрузку из 1С в экселе, где эксель уже вовсю применил свой интеллект по автоопределению формата.
источник

AB

Alexey Burnakov in R (язык программирования)
Это вылилось в то, что я психанул и начал делать реверс инжениринг дат в цифры.
источник

AB

Alexey Burnakov in R (язык программирования)
Оказалось, что некоторые даты не могут быть однозначно переведены обратно в цифры.
источник

AB

Alexey Burnakov in R (язык программирования)
Грусть.
источник

AB

Alexey Burnakov in R (язык программирования)
источник