Телеграмм чат группы rlang_ru страница 3235

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R (язык программирования)

1421 membersпожаловаться на группу

2021 June 27

PD

Pavel Demin in R (язык программирования)

оо, не пятница, так вечер воскресенья. имхо cte читабельнее с точки зрения того, что можно читать top-down, по минимуму двигая глазами в разные стороны

источник

22:02пожаловаться #1

ДВ

Дмитрий Володин... in R (язык программирования)

всё как всегда зависит от субд)

источник

22:03пожаловаться #2

PU

Philipp Upravitelev in R (язык программирования)

это да. у меня на работе псевдо sql, так там cte выполняются при каждом обращении к ним, а не однократно %(

источник

22:04пожаловаться #3

PU

Philipp Upravitelev in R (язык программирования)

но обычно все же это однократное выполнение, насколько я знаю

источник

22:04пожаловаться #4

ДВ

Дмитрий Володин... in R (язык программирования)

если в одном запросе несколько cte, то всё равно сложно. По-программерски вроде ок - объявили -> используем. Но вот по трансформации данных как-то не очень. Но с подзапросами дургая беда: нужно держать жёсткую дисциплину в плане query style guide

источник

22:05пожаловаться #5

PU

Philipp Upravitelev in R (язык программирования)

я видел такое, во что вы, люди, просто не поверите. left join на той же строке, что и from, group by 1, 2 для дедупликации, хаотичные отступы в субзапросах...

источник

22:08пожаловаться #6

ДВ

Дмитрий Володин... in R (язык программирования)

Ну это примерно как -> в R))

источник

22:10пожаловаться #7

AP

Aleksandr Pidtykan in R (язык программирования)

Вроде простенькая задача:
1 сортируем по дате и делаем row_numbers по юзеру
2 выбираем где первые пустыня вторые болота и наооборот,
и все решение как по мне

источник

22:10пожаловаться #8

PU

Philipp Upravitelev in R (язык программирования)

я сам не идеален, я операторы пишу маленькими буквами, олдфаги бесятся... но тут даже мне плохо было :(

источник

22:11пожаловаться #9

PU

Philipp Upravitelev in R (язык программирования)

там чуть сложнее, уровней около 100, и с 30 пустыня и болото могут идти в разном порядке, как пользователь решит, просто на первый - второй не разбить
но да, направление примерно такое, спасибо

источник

22:13пожаловаться #10

AP

Aleksandr Pidtykan in R (язык программирования)

У меня IDE с маленькой буквы операторы пишет и переводит по автозаполнение. По началу это сильно бесило, поставил стили и темы теперь они цветом отличаются и привык

источник

22:13пожаловаться #11

PU

Philipp Upravitelev in R (язык программирования)

ну вот я как раз полагаюсь на цветовую схему при выделении ключевых слов, а не на регистр.

источник

22:14пожаловаться #12

PU

Philipp Upravitelev in R (язык программирования)

но есть те, кто говорит, что неканон

источник

22:14пожаловаться #13

PU

Philipp Upravitelev in R (язык программирования)

к слову, рстудия все никак не запилит поддержку sql синтаксиса в r-скриптах, а жаль :(

источник

22:15пожаловаться #14

PU

Philipp Upravitelev in R (язык программирования)

приходится как простой текст писать :(

источник

22:15пожаловаться #15

PD

Pavel Demin in R (язык программирования)

я заранее извиняюсь перед всеми, кто пишет на sql часто и/или нормально, слишком не ругайте, я профан

Филипп, развивая тему про string_agg в BQ: уверен, можно написать это лучше (а озвученное решение с лагом выглядит еще лучше), но, как я часто говорю, раз встрял - надо что-то написать.

with tmp as (
    select 1 as user_id, 'swamp' as level, 'lost' as result union all 
    select 1, 'swamp', 'won' union all 
    select 1, 'swamp', 'won' union all 
    select 2, 'desert', 'won' union all 
    select 2, 'swamp', 'list' union all 
    select 3, 'desert', 'lost' union all 
    select 3, 'swamp', 'won'
)
, process_table as (
    select 
        result, 
        string_agg(level, ' > ') over (partition by user_id rows between current row and 1 following ) as process
    from tmp
)

select result as first_result, process, count(*) as N
from process_table
where array_length(split(process, " > ")) > 1
group by result, process
order by count(*) desc

источник

22:17пожаловаться #16

PU

Philipp Upravitelev in R (язык программирования)

спасибо, чуть позже сегодня попробую!

источник

22:20пожаловаться #17

PD

Pavel Demin in R (язык программирования)

ну и наркоманию я все-таки написал.
не скажу, что через лаг (лид) у меня получилось лучше, но понять такое, наверное, проще

with tmp as (
    select 1 as user_id, 'swamp' as level, 'lost' as result union all 
    select 1, 'swamp', 'won' union all 
    select 1, 'swamp', 'won' union all 
    select 2, 'desert', 'won' union all 
    select 2, 'swamp', 'list' union all 
    select 3, 'desert', 'lost' union all 
    select 3, 'swamp', 'won'
)

, process_table as (
    select 
        result, 
        level as level_one, 
        lead(level) over (partition by user_id order by user_id) as level_two
    from tmp
)

select
    *, count(*) as N
from process_table
where level_two is not null
group by result, level_one, level_two
order by result, level_one, level_two;

источник

22:40пожаловаться #18

IS

Ilya Shutov in R (язык программирования)

не очень понятно, а почему наружу не вытащить все эти дуплеты и посчитать отдельно?
сколько там этих кейсов?

источник

23:06пожаловаться #19