Size: a a a

R (язык программирования)

2020 May 26

JS

Jury Sergeev in R (язык программирования)
источник

AS

Alexander Semenov in R (язык программирования)
Прикольно этот ваш fread() не угадывает кодировку там, где read_csv() справляется без проблем.
источник

PD

Pavel Demin in R (язык программирования)
Alexander Semenov
Прикольно этот ваш fread() не угадывает кодировку там, где read_csv() справляется без проблем.
источник

K

Konstantin in R (язык программирования)
источник

K

Konstantin in R (язык программирования)
Добрый день, каким способом можно разбить данные, сформированные  в таком виде в таблицу год - месяц - день?
источник

AS

Alexey Seleznev in R (язык программирования)
Konstantin
Добрый день, каким способом можно разбить данные, сформированные  в таком виде в таблицу год - месяц - день?
1. а что там за звёздочки?
2. можете дать код с помощью которого вы эти данные получили?
источник

K

Konstantin in R (язык программирования)
Это список нерабочих дней, скачал https://data.gov.ru/opendata/resource/8ba5011a-233e-4e01-a1d2-ff5598d0f34f#6/51.522/-200.380
источник

AS

Alexey Seleznev in R (язык программирования)
Konstantin  а ваша задача просто получить список официальных рабочих и не рабочих дней в РФ что ли?
источник

AS

Alexey Seleznev in R (язык программирования)
или именно развернуть эту бредовую таблицу?
источник

AS

Alexey Seleznev in R (язык программирования)
Konstantin
Это список нерабочих дней, скачал https://data.gov.ru/opendata/resource/8ba5011a-233e-4e01-a1d2-ff5598d0f34f#6/51.522/-200.380
ну если это разворачивать то вот так

library(dplyr)
library(tidyr)
library(stringr)

Sys.setlocale("LC_CTYPE", "russian")
data <- read.csv("https://data.gov.ru/opendata/7708660670-proizvcalendar/data-20191112T1252-structure-20191112T1247.csv?encoding=CP1251")

data %>%
 select(Год.Месяц, Январь:Декабрь) %>%
 pivot_longer(Январь:Декабрь, names_to = "month", values_to = "days") %>%
 mutate(days = str_split(days, ",")) %>%
 unnest_longer(days)
источник

AS

Alexey Seleznev in R (язык программирования)
результат:

# A tibble: 3,278 x 3
  Год.Месяц month  days
      <int> <chr>  <chr>
1      1999 Январь 1    
2      1999 Январь 2    
3      1999 Январь 3    
4      1999 Январь 4    
5      1999 Январь 6*  
6      1999 Январь 7    
7      1999 Январь 9    
8      1999 Январь 10  
9      1999 Январь 16  
10      1999 Январь 17  
# ... with 3,268 more rows
источник

K

Konstantin in R (язык программирования)
Alexey Seleznev
Konstantin  а ваша задача просто получить список официальных рабочих и не рабочих дней в РФ что ли?
Да, задача именно в этом, за пример кода большое спасибо!
источник

AS

Alexey Seleznev in R (язык программирования)
в таком случае есть гораздо проще способ, в пакете timeperiodsR уже реализован производственный календарь для РФ, Украины, Казахстана и Белоруссии

https://youtu.be/meYb5LRV3k8
источник

K

Konstantin in R (язык программирования)
Спасибо!
источник

АК

Артём Клевцов... in R (язык программирования)
Alexander Semenov
Прикольно этот ваш fread() не угадывает кодировку там, где read_csv() справляется без проблем.
Ты, это, полегче. Нигде и никогда не было заявлено, что он угадывает кодировку. Только разделители. Кодировку указываешь сам или предварительно конвертишь через iconv.
Сама фича «угадывания» кодировки никому на самом деле не нужна, т.к. работает крайне не стабильна из-за самих алгоритмов «угадывания». Ни в какой воспроизводимый код и уж тем более прод такой код никогда не примут.
источник

AS

Alexander Semenov in R (язык программирования)
Я к тому, что мне тут приспичило 6 файлов на 5 Гб в датафрейм собрать и впервые за несколько лет пришлось прописывать кодировку руками.
источник

АК

Артём Клевцов... in R (язык программирования)
Alexander Semenov
Я к тому, что мне тут приспичило 6 файлов на 5 Гб в датафрейм собрать и впервые за несколько лет пришлось прописывать кодировку руками.
Её всегда надо прописывать, если она не UTF-8.
источник

AS

Alexander Semenov in R (язык программирования)
А тут пришлось прописать UTF-8.
источник

AS

Alexander Semenov in R (язык программирования)
read_csv() по дефолту всё корректно считывал.
источник
2020 May 27

AS

Alexander Semenov in R (язык программирования)
Коллеги, а можно ли для задачи ультравоспроизводимости анализа данных в Rmd как-то выводить не только названия файлов, которые были использованы но и их вес/контрольную сумму или ещё что-то подобное?
источник