Size: a a a

R language and Statistical data analysis

2020 May 15

БА

Байкулов Антон... in R language and Statistical data analysis
источник

ЕБ

Евгений Балакловский... in R language and Statistical data analysis
хм, поковыряю, но это же чето по шопифаю конкретно
источник

A

Alexey in R language and Statistical data analysis
Евгений Балакловский
по сути, если проблему непонятно описал, то это должно выглядеть в конечном решении так:

получаем реквест в реал-тайм -> R делает предобработку -> льет в базу

вот если ктото мануал по такому etl извращению видел, то тысяча благодарностей
openCPU
источник

АК

Артём Клевцов... in R language and Statistical data analysis
Евгений Балакловский
по сути, если проблему непонятно описал, то это должно выглядеть в конечном решении так:

получаем реквест в реал-тайм -> R делает предобработку -> льет в базу

вот если ктото мануал по такому etl извращению видел, то тысяча благодарностей
plumber/restrserve такое могут.
источник

AP

Anton Pysanka in R language and Statistical data analysis
Олег Логинов
Переслано от Олег Логинов
library(shiny)
library(miniUI)
library(taskscheduleR)
library(rvkstat)
library(openxlsx)

myToken <- vkAuth(app_id = ***,
                 app_secret = '***')

# статистика сообщества
# получить список всех групп пользователя
my_groups <- vkGetUserGroups(access_token = myToken$access_token)

# общаяя статистика по сообществу
gr_stat <- vkGetGroupStat(date_from = "2020-01-01",
                         date_to = "2020-12-31",
                         group_id = ***,
                         access_token = myToken$access_token)

# статистика по посетителям сообщества в разбивке по возрасту
gr_stat_age <- vkGetGroupStatAge(date_from = "2020-01-01",
                                date_to = "2020-12-31",
                                group_id = ***,
                                access_token = myToken$access_token)

# статистика по посетителям сообщества в разбивке по полу
gr_stat_gender <- vkGetGroupStatGender(date_from = "2020-01-01",
                                      date_to = "2020-12-31",
                                      group_id = ***,
                                      access_token = myToken$access_token)

# статистика по посетителям сообщества в разбивке по полу и возрасту
gr_stat_gen_age <- vkGetGroupStatGenderAge(date_from = "2020-01-01",
                                          date_to = "2020-12-31",
                                          group_id = ***,
                                          access_token = myToken$access_token)

# статистика по посетителям сообщества в разбивке по городам
gr_stat_city <- vkGetGroupStatCity(date_from = "2020-01-01",
                                  date_to = "2020-12-31",
                                  group_id = ***,
                                  access_token = myToken$access_token)

# статистика по посетителям сообщества в разбивке по странам
gr_stat_country <- vkGetGroupStatCountries(date_from = "2020-01-01",
                                          date_to = "2020-12-31",
                                          group_id = ***,
                                          access_token = myToken$access_token)

write.xlsx(gr_stat, "C:/Users/Oleg/Documents/R/win-library/4.0/taskscheduleR/extdata/gr_stat_final.xlsx")
write.xlsx(gr_stat_age, "C:/Users/Oleg/Documents/R/win-library/4.0/taskscheduleR/extdata/gr_stat_age_final.xlsx")
write.xlsx(gr_stat_gender, "C:/Users/Oleg/Documents/R/win-library/4.0/taskscheduleR/extdata/gr_stat_gender_final.xlsx")
write.xlsx(gr_stat_gen_age, "C:/Users/Oleg/Documents/R/win-library/4.0/taskscheduleR/extdata/gr_stat_gen_age_final.xlsx")
write.xlsx(gr_stat_city, "C:/Users/Oleg/Documents/R/win-library/4.0/taskscheduleR/extdata/gr_stat_city_final.xlsx")
write.xlsx(gr_stat_country, "C:/Users/Oleg/Documents/R/win-library/4.0/taskscheduleR/extdata/gr_stat_country_final.xlsx")
первые 3 библиотеки не нужны, попробуйте еще поменять в путях каждый / на \\
и пройдитесь по списку вариантов решения, что я кидал выше
источник

ОЛ

Олег Логинов... in R language and Statistical data analysis
Anton Pysanka
первые 3 библиотеки не нужны, попробуйте еще поменять в путях каждый / на \\
и пройдитесь по списку вариантов решения, что я кидал выше
вот так попробовал

library(taskscheduleR)
library(openxlsx)

## Указываем название файла R скрипта для последующей работы с ним (VKontakte)
myscriptVK <- system.file("extdata", "API-VK.R", package = "taskscheduleR")
myscript_stat <- system.file("extdata", "gr_stat_final.xlsx", package = "taskscheduleR")

## Запуск скрипта ежедневно в 09:05, начиная с завтрашнего дня
## Важно: необходимо поменять формат даты, если он не совпадает с тем, что стоит на компьютере (пример: %m/%d/%Y)
taskscheduler_create(taskname = "myscriptdaily", rscript = myscript_stat,
                    schedule = "DAILY", starttime = "09:05",
                    startdate = format(Sys.Date()+1, "%d/%m/%Y"))
источник

ОЛ

Олег Логинов... in R language and Statistical data analysis
тоже ничего
источник

JS

Jury Sergeev in R language and Statistical data analysis
Евгений Балакловский
по сути, если проблему непонятно описал, то это должно выглядеть в конечном решении так:

получаем реквест в реал-тайм -> R делает предобработку -> льет в базу

вот если ктото мануал по такому etl извращению видел, то тысяча благодарностей
а что в рилтйме нужно? прием заявок или немедленная отдача результата в БД?
источник

ЕБ

Евгений Балакловский... in R language and Statistical data analysis
это по факту лог работы в CRM
источник

JS

Jury Sergeev in R language and Statistical data analysis
Евгений Балакловский
это по факту лог работы в CRM
и данные шлет эта CRM, так?
источник

ЕБ

Евгений Балакловский... in R language and Statistical data analysis
да!
источник

ЕБ

Евгений Балакловский... in R language and Statistical data analysis
В CRM заявка переходит туда-сюда из статуса в статус. У CRM есть вебхуки, по которым можно отслеживать события перехода заявки по статусам, вот мне и хотелось это все складировать в рил-тайме и дальше анализировать манагеров
источник

ЕБ

Евгений Балакловский... in R language and Statistical data analysis
боль в том, что у меня нет инженерных знаний, но вот воронку могу покрутить))
источник

ЕБ

Евгений Балакловский... in R language and Statistical data analysis
за openCPU/plumber/restrserve неравнодушным выше спасибо , посмотрю тоже
источник

AP

Anton Pysanka in R language and Statistical data analysis
Олег Логинов
тоже ничего
создавать задание нужно через визуальный интерфейс в Addins

при создании смотрите что выводит в консоль: может быть ошибка из-за длинного названия скрипта – тогда задание не создастся
источник

ОЛ

Олег Логинов... in R language and Statistical data analysis
через него и создаю
источник

СБ

Сергей Белянкин... in R language and Statistical data analysis
Господа профессионалы подскажите. Нужно извлеч весь html код в блоке. Обрабатываю парсинг страницы, получаю объект класса xml_nodeset. Далее хочу получить лист с элементами класса "character". Как обратиться или преобазовать переменную?

Пример кода:
> text_1 <- xml_find_all(ParsingUrl, xpath = path_text) %>%  xml_contents()
> text_1
{xml_nodeset (3)}
[1] <h2>Подзаголовок</h2>
[2] <p>первый параграф...</p>
[3] <p>второй параграф...</p>

Нужно:
> text_1
[[1]]
[1] "<h2>Подзаголовок</h2>"

[[2]]
[1] "<p>первый параграф...</p>"

[[3]]
[1] "<p>второй параграф...</p>"
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
есть же rvest
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
для html, логика точно такая же, так как он идет как надстройка над xml2
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
html_nodes(ParsingUrl, xpath = path_text) %>%  html_text()
источник