Size: a a a

R (язык программирования)

2020 October 26

AS

Alexander Semenov in R (язык программирования)
Сто раз уже тут эту тему обмусоливали. Ничего нового с тех пор я добавить не могу.
источник

АК

Артём Клевцов... in R (язык программирования)
Alexander Semenov
В общем, вброшу в последний раз, и больше не буду. Мои "плачи Ярославны" тут обусловлены лишь тем, что в 2020 году мне приходится объяснять человеку, который раньше занимал моё место, а сейчас руководит разработчиками, выполняющими мои бизнес-задачи, что:
* сначала нужно навести порядок в данных, а потом заниматься дашбордами;
* SQL-запросы мне нужнее и важнее дашбордов потому, что способствуют прозрачности аналитической работы.

О том, что мне в запросе на данные не прикрепили файл или забыли туда добавить какое-то важное поле, я бы сюда писать никогда не стал. Для этого есть другие чяты.
Да вбрасывай на здоровье 😁 Я переживаю лишь за разнообразие контента (а с ним в последнее время беда прямо) и практическую пользу для сообщества.
источник

AS

Alexander Semenov in R (язык программирования)
Я вот больше переживаю за разнообразие контента и вот это всё в https://www.reddit.com/r/Rlanguage/ и https://www.reddit.com/r/rprogramming/. Если это действительно самые популярные сабреддиты по R, то мне очень грустно и тревожно.
источник

R

R in R (язык программирования)
а почему тревожно? сабреддиты по языкам это какая-то совсем странная штука, неудивительно, что модераторы там такие, что сабреддит превратился в (или всегда был) херовую версию стэковерфлоу
источник

AS

Alexander Semenov in R (язык программирования)
Ну вот я зашёл в сабреддит смежного языка программирования и там, на первый взгляд, жизнь бьёт ключем.
источник

AS

Alexander Semenov in R (язык программирования)
Нам-то понятно, что все новости по теме в r-bloggers и ТвиттОре, но что же делать новичкам, о которых тут недавно так пеклись? Активность на Reddit -- какой-никакой показатель у этих зумеров или как их там.
источник

R

R in R (язык программирования)
Ну новичкам как раз сабреддит с вопросами о том, как использовать dplyr::filter(), подойдет, нет?
источник

R

R in R (язык программирования)
там скорее контента для более продвинутых нет
источник

AS

Alexander Semenov in R (язык программирования)
Ну да, я в первую очередь о своих интересах пекусь. Недавно пытался собрать себе в реддите нормальную ленту, но по теме R/андан/ML/DS вышел какой-то пшик. Хотя точно помню, что тут кто-то писал, что регулярно там находит интересные сообщества. Видимо не по этой тематике.
источник

IS

Ivan Struzhkov in R (язык программирования)
Alexander Semenov
Сто раз уже тут эту тему обмусоливали. Ничего нового с тех пор я добавить не могу.
раз тут на тему ускорения извлечения из листа не пишут, то я проблематики там и не понял. Есть мутный чувак который предлагает дешборды а не SQL. Есть выбор - перевоспитывать чувака, соглашаться на дешборды или валить. Этот выбор внутренний.
источник

AS

Alexander Semenov in R (язык программирования)
Т.к. бизнес-заказчик я и право имею, то вариант-то очевиден. Просто надо же где-то поделиться боль... т.е. опытом.
источник

PU

Philipp Upravitelev in R (язык программирования)
Ivan Struzhkov
раз тут на тему ускорения извлечения из листа не пишут, то я проблематики там и не понял. Есть мутный чувак который предлагает дешборды а не SQL. Есть выбор - перевоспитывать чувака, соглашаться на дешборды или валить. Этот выбор внутренний.
я бы делал так. насколько это быстрее - хз
> library(data.table)
> tmp_dt <- as.data.table(tmp)
> tmp_dt <- tmp_dt[, list(vals = unlist(y)), by = x]
> tmp_dt[, index := 1:.N, by = x]
> dcast(tmp_dt, x ~ index, value.var = 'vals', fill = NA)
  x 1    2    3
1: 1 a    b <NA>
2: 2 a <NA> <NA>
3: 3 u    x    z
4: 4 a    b <NA>
5: 5 a <NA> <NA>
источник

IS

Ivan Struzhkov in R (язык программирования)
а понял, это логика сначала в длинную раскрутить а потом dcast сделать, так должно быть быстро, я только в dcast не уверен, это вроде из reshape2 пакета
источник

AS

Alexander Semenov in R (язык программирования)
*шутка про `pivot_wider()`*
источник

IS

Ivan Struzhkov in R (язык программирования)
))) хотя везде в рекомендациях - рядом с data table действительно melt и dcast для таких задач
источник

AS

Alexander Semenov in R (язык программирования)
Детский вопрос: написание filter() в начале или в конце цепочки пайпов как-то влияет на производительность?
источник

PU

Philipp Upravitelev in R (язык программирования)
Ivan Struzhkov
а понял, это логика сначала в длинную раскрутить а потом dcast сделать, так должно быть быстро, я только в dcast не уверен, это вроде из reshape2 пакета
есть свой метод для data.table
источник

PU

Philipp Upravitelev in R (язык программирования)
Alexander Semenov
*шутка про `pivot_wider()`*
синтаксис которого скопировали с dcast :)
источник

AS

Alexander Semenov in R (язык программирования)
Alexander Semenov
Детский вопрос: написание filter() в начале или в конце цепочки пайпов как-то влияет на производительность?
Судя по system.time(), влияет.
источник

IS

Ivan Struzhkov in R (язык программирования)
Philipp Upravitelev
синтаксис которого скопировали с dcast :)
ну любим мы дата тейбл не только за синтаксис.)
источник