Size: a a a

R (язык программирования)

2021 June 22

AS

Alexander Semenov in R (язык программирования)
Clickhouse в стейджинг -> Greenplum в DDS -> Его же в ADS. И никаких проблем.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Обидно даже мальца. Функционал с массивами и лямбдами намного круче оконок. Аналитические функции роскошные. Всë супер быстро, если уметь пользоваться. Ну а ждать транзакций не от oltp СУБД в принципе странно.

Чтобы не флудить. Кликахус - отличная именно аналитическая СУБД. Если вам надо вести отчëтность бухгалтерскую - тогда лучше не стоит его заводить))
источник

P

Pasha in R (язык программирования)
неистово плюсую
источник

AS

Alexander Semenov in R (язык программирования)
А уж мне-то как обидно. У меня-то КХ и вовсе только с тормозами ассоциируется из-за того, что у нас он только на 1 инстансе установлен.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
У меня тоже на одном, и оперативки там немного. Но сотнями миллионов строк как-то удаётся оперировать очень неплохо.
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Завершая топик про кликхаус. В нём мне понравился именно функциональный подход, почему было довольно просто освоить его фишки все после Р. Есть поля, есть функции. Есть задачи вернуть таблицу определённого вида. Всё, что мне надо, подобрать правильные функции и правильные аргументы (зачастую результаты вызова других функций) к ним. Поэтому если вам импонирует функциональный стиль. Для меня переезд (в плане перевод всех data wrangling процедур) на кликхаус в своё время был очень безболезненным именно благодаря опыту и в R (base, dplyr, data.table).
источник

BA

Bogdan Avramenko in R (язык программирования)
Кликхаус на одной ноде)) Странное зрелище. Не используется ключевая фишка, ради чего его вообще ставят. Это как ножки КФС без кожи в панировке, хах

Ну, у всех свои вкусы)
источник

ДВ

Дмитрий Володин... in R (язык программирования)
По факту четыре, одна выделена под определённые нужды. Одна нода была нужна потому что функционал одной внешней библиотеки не позволял работать на кластере. Сейчас туда эту фишку накатили, тестируем. Так что тут дела не вкуса, а необходимости
источник

AG

Alenka Grosheva in R (язык программирования)
Добрый вечер! Не могли бы, пожалуйста, подсказать функцию: у меня есть два столбца с данными, мне нужно посчитать среднее по строчкам столбцов и засунуть это в новый столбец
источник

AG

Alenka Grosheva in R (язык программирования)
Условно вот: переменные x2_1 и x3_1 ( нужно сделать так, что получился новый столбец с их средними по строчкам)
источник

ИП

Иван Поздняков... in R (язык программирования)
colMeans
источник

ИП

Иван Поздняков... in R (язык программирования)
а или rowMeans
источник

ИП

Иван Поздняков... in R (язык программирования)
но тут уж вам виднее будет
источник

⌨️ in R (язык программирования)
Рискну предложить purrr::map2_dbl если столбцов строго два
источник

⌨️ in R (язык программирования)
Или 0.5*(x2_1 + x3_1)
источник

ГД

Григорий Демин... in R (язык программирования)
А чем не подходит просто (x2_1 + x3_1)/2 ?
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
))))))
источник
2021 June 23

М

Марк in R (язык программирования)
Привет) @semenoffalex, не знаю, актуально еще или нет, но кажется, я разобрался, как всегда получать нормальную кирилицу от RMySQL.

Надо не только прописать
dbSendQuery(conn, "SET NAMES cp1251"). Это позволит считывать из БД данные которые в существующую таблицу записаны кириллицей. Но если столбец создан select-запросом и обозван кириллицей, или в его ячейках есть кириллица, то все равно будут возвращаться крякозябры.

Чтобы этого не было надо создать функцию:
set_utf8 <- function(x) {
 # Declare UTF-8 encoding on all character columns:
 chr <- sapply(x, is.character)
 x[, chr] <- lapply(x[, chr, drop = FALSE], `Encoding<-`, "UTF-8")
 # Same on column names:
 Encoding(names(x)) <- "UTF-8"
 x
}

И потом каждый раз оборачивать в нее запрос к БД:

from_base <- set_utf8(dbGetQuery(conn, query))
источник

М

Марк in R (язык программирования)
Ну и, кстати, для RPostgreSQL достаточно просто прописать эту функцию и будет работать. Единственное, не дает обзывать столбцы кириллицей в select-запросе
источник

AS

Alexander Semenov in R (язык программирования)
Спасибо, сохраню. В этот раз хватило одного dbSendQuery(), но кто знает...
источник