Size: a a a

R (язык программирования)

2021 June 14

v

vovanz in R (язык программирования)
как правильно задать русский язык, код выдает ошибку, а без задания языка распознает очень плохо
text_data <- pdf_ocr_data(pdf = dir(path = "F:/Rproj/Документы конкурса грантов КНВШ", full.names = T)[10], language = "rus")
источник

AP

Aleksandr Pidtykan in R (язык программирования)
Я тоже делал но мне больше нужны были таблицы. Выход конвертировать все в html и обычно парсить
источник

v

vovanz in R (язык программирования)
у меня pdf со сканера там картинки с текстом
источник

A

Alexandr in R (язык программирования)
ой, кажется, что самый то простой вариант пропустили

letters_1 <- vector()
for (i in 1:length(letters)) {
 letters_1[i] <- paste0(
   letters[12],
   letters[5],
   letters[20],
   letters[20],
   letters[5],
   letters[18],
   letters[i]
 )
}
источник

v

vovanz in R (язык программирования)
как оказалось достаточно было с гитхаба скачать файл русского языка и скопировать его в AppData\Local\tesseract4\tesseract4\tessdata, теперь осталось победить кодировку
источник

a

aGricolaMZ in R (язык программирования)
Я обкачал все ваковские решения и извлекал степени
источник

v

vovanz in R (язык программирования)
с русским языком довольно не плохо распознает
источник

I

Igor in R (язык программирования)
Привет!
Кто-нить может подсказать почему съедает последний символ? Или как этого избежать.
strsplit("Don Mathu, Paul eat that!", "[^,][ ]")
Не смог нагуглить, что не так.
Цель - фио не сплитить.
источник

A

Andrey in R (язык программирования)
https://regexr.com/ вот сюда пихаешь регулярку, и все проясняется
источник

A

Andrey in R (язык программирования)
деление идет по любому символу, кроме запятой, с последующим пробелом. Ровно эта комбинация и была вырезана, т.к. она рассматривается в качестве разделителя
источник

h

helby in R (язык программирования)
Привет.

Подскажите, есть столбец с датами, шаг = 1 день

Нужно создать столбец, чтобы для каждой даты создавалось время с шагом 15 мин

Как это сделать?
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Дата из первого столбца плюс 15 минут? Или нужно разбить на меньшие интервалы существующий столбец? С дня до 15 минут
источник

h

helby in R (язык программирования)
ну каждую дату разбить на всё время дня, с 00.00 + 15 минут и до 23.45
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Посмотрите lubridate и tsibble пакеты. В последнем есть fill_gaps. Может подойдëт. В последний раз, когда мне понадобилось сделать что-то такое, я просто делал вектор с unix-timestamp от минимума до максимума и просто делил, округлял и умножал. А дальше обычный мëрдж или джоин
источник

h

helby in R (язык программирования)
понял, спасибо большое)))
источник

IS

Ilya Shutov in R (язык программирования)
например, так:
seq(lubridate::dmy_h("14-06-2021 00", tz = "Europe/Moscow"), by = 15 * 60, length.out = 24 * 4)
источник

h

helby in R (язык программирования)
спасибо

а если мне надо создать не для одной даты, а для года, то я в length.out ставлю 365, а в by , если не 15 мину, а час, то 1*12 , верно?
источник

IS

Ilya Shutov in R (язык программирования)
можно просто конец задать from - to
Либо использовать tsibble. Но тащить пакет из-за микрозадачи нет смысла, там уж стоит все изучать.
источник

IS

Ilya Shutov in R (язык программирования)
POSIXct —это unixtimestamp со всеми вытекающими
источник

AP

Aleksandr Pidtykan in R (язык программирования)
Гугл в данном случае чем плох ? seq(as.POSIXct("2017-01-01", tz = "UTC"), as.POSIXct("2017-01-02", tz = "UTC"), by = "30 min")
источник