Телеграмм чат группы rlang_ru страница 2469

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R (язык программирования)

1246 membersпожаловаться на группу

2020 October 28

AS

Alexander Semenov in R (язык программирования)

Philipp Upravitelev

добавь к решению выбор одной строки каждого san (features[, .SD[1], by = account_number] ), и получишь нужный тебе результат

Ну в общем `features[, .SD[1], by = account_number]` did the trick. Спасибо. На свежую голову подумаю, как это переписать the tidy way.

источник

00:13пожаловаться #1

PU

Philipp Upravitelev in R (язык программирования)

зачем? оно ж будет медленнее

источник

00:14пожаловаться #2

AS

Alexander Semenov in R (язык программирования)

Ну хотя бы для того, чтобы разобраться, как же работает этот slice_sample().

источник

00:15пожаловаться #3

AS

Alexander Semenov in R (язык программирования)

Или что мне там для этой задачи надо

источник

00:15пожаловаться #4

PU

Philipp Upravitelev in R (язык программирования)

ты ж хотел на dt переходить :)

источник

00:20пожаловаться #5

AS

Alexander Semenov in R (язык программирования)

Да. Просто мне кажется странным уметь выполнять операцию (не самую редкую) только в одном фреймворке и не уметь в другом.

Моя сейчас делает анализ датасета на кеггле для портфолио, так у ней на одной строке gsub(), а на следующей — str_replace(). Я ей сказал, что это будет плохо смотреться. Ну и самому бы своим словам не мешало следовать.

источник

00:24пожаловаться #6

PU

Philipp Upravitelev in R (язык программирования)

логично

источник

00:29пожаловаться #7

С

Сергей Якунин... in R (язык программирования)

😀 Привет пипл

источник

04:22пожаловаться #8

АК

Артём Клевцов... in R (язык программирования)

Philipp Upravitelev

добавь к решению выбор одной строки каждого san (features[, .SD[1], by = account_number] ), и получишь нужный тебе результат

Может просто unique by?

источник

06:19пожаловаться #9

АК

Артём Клевцов... in R (язык программирования)

Philipp Upravitelev

не, я не понимаю этот мир
ну зачем dt_case_when() for dplyr::case_when(), когда есть fcase с аналогичным синтаксисом
dt_pivot_wider() вообще смешно. сначала gather заменили на pivot_wider(), по легкой аналогии с dcast, потом сделали аналог аналога.

fcase появился совсем не давно. Скорее всего dt_case_when был реализован, когда fcase ещё не было.

источник

07:14пожаловаться #10

A

Andrey in R (язык программирования)

Alexander Semenov

Я не понимаю, что значит "и их строк"? Если это записи этих 2000 san, за все даты, что есть в исходной таблице, то это не то, что мне надо. Мне нужно 2000 строк с 2000 уникальных san. Дата (пока) значения не имеет.

Есть быстрое решение через self join.

источник

10:14пожаловаться #11

AS

Alexander Semenov in R (язык программирования)

Да я вчера по бессознанке наколбасил что-то типа df %>% group_by(id) %>% slice_sample(n=1) %>% ungroup() %>% sample_n(2000). Но что-то мне подсказывает, что это не самый эстетичный вариант.

источник

10:18пожаловаться #12

A

Andrey in R (язык программирования)

https://stats.stackexchange.com/questions/7884/fast-ways-in-r-to-get-the-first-row-of-a-data-frame-grouped-by-an-identifier

Cross Validated

Fast ways in R to get the first row of a data frame grouped by an identifier

Sometimes I need to get only the first row of a data set grouped by an identifier, as when retrieving age and gender when there are multiple observations per individual. What's a fast (or the faste...

источник

10:18пожаловаться #13

A

Andrey in R (язык программирования)

Смотри ответ Мэтта. Я таким образом раз в 100 ускорился

источник

10:18пожаловаться #14

AS

Alexander Semenov in R (язык программирования)

Спасибо.

источник

10:20пожаловаться #15

AS

Alexander Semenov in R (язык программирования)

Тут недавно КХ нахваливали, а я вот не помню, когда у меня к нашему КХ в последний раз запрос отбегал без падений. Уники по РФ/типам устройств за месяц не могу посчитать. А там всего каких-то 14 млрд. записей провернуть надо.

источник

10:59пожаловаться #16

AS

Alexander Semenov in R (язык программирования)

Это в КХ или кривых руках разрабов проблема?

источник

10:59пожаловаться #17

АК

Артём Клевцов... in R (язык программирования)

Партиции должны решать проблему, чтобы не сканить всю таблицу.

источник

11:00пожаловаться #18

ЕТ

Евгений Томилов... in R (язык программирования)

Дамы и господа, помогите найти, пожалуйста. Я хочу рассчитать мощность для теста пропорций non-inferiority при условии, что у меня отношение групп не 1:1, а 0.93.

источник

11:06пожаловаться #19

ЕТ

Евгений Томилов... in R (язык программирования)

Но не могу нагуглить никак модификацию.

источник

11:06пожаловаться #20