Телеграмм чат группы rlang_ru страница 2460

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

R (язык программирования)

1246 membersпожаловаться на группу

2020 October 27

АК

Артём Клевцов... in R (язык программирования)

Данные агрегированы, в результате их в дашборд отдаётся не много (не более тысячи строк). Само приложение рядом. Интересует именно быстродействие БД и возможность выполнять множество параллельных запросов с агрегацией без потери скорости.

источник

12:42пожаловаться #1

JS

Jury Sergeev in R (язык программирования)

КХ параллелен, хватает все что есть на сервере

источник

12:44пожаловаться #2

JS

Jury Sergeev in R (язык программирования)

фильтрация даже по raw-тексту - быстрая, но надо партиционирование сделать оптимальнее именно под выборку

источник

12:45пожаловаться #3

АК

Артём Клевцов... in R (язык программирования)

Постгря сильно проседает при нагрузочном тестирование бэкенда (100 параллельных запроса), но я её ещё особо не тюнил под это дело.

источник

12:45пожаловаться #4

JS

Jury Sergeev in R (язык программирования)

а еще никто не отменял шардирование - и тогда параллельные запросы будут к разным физ. шардам

источник

12:46пожаловаться #5

JS

Jury Sergeev in R (язык программирования)

ну и диски надо быстрые, если много массивных параллельных чтений

источник

12:48пожаловаться #6

AS

Alexander Semenov in R (язык программирования)

Philipp Upravitelev

к слову, я не могу сказать, что мне как-то очень часто нужны оконные функции

Мне вот тоже кажется, что они по большей части нужны для того, чтобы кандидатов на собеседованиях отсеивать =)

источник

12:55пожаловаться #7

AS

Alexander Semenov in R (язык программирования)

Артём Клевцов

Это на КХ? Я думал, оно как раз заточен на то, чтобы быстро фильтровать и агрегировать, что для дашбордов самое оно.

Да. У нас там событий адовые миллионы и данные к КХ хранятся по сессиям. Может поэтому.

источник

12:56пожаловаться #8

JS

Jury Sergeev in R (язык программирования)

Alexander Semenov

Да. У нас там событий адовые миллионы и данные к КХ хранятся по сессиям. Может поэтому.

очень даже запросто, возможно надо мельче делать партиции, зависит от...

источник

12:59пожаловаться #9

АК

Артём Клевцов... in R (язык программирования)

очень даже запросто, возможно надо мельче делать партиции, зависит от...

Какая логика разбиения должна быть?

источник

13:01пожаловаться #10

JS

Jury Sergeev in R (язык программирования)

Артём Клевцов

Какая логика разбиения должна быть?

а это по потребителям данных смотреть, какие части данных им нужны, и от этого плясать, ну например если за неделю данные берут - ну бьем по суткам, например, ну и далее вглубь идем

источник

13:02пожаловаться #11

JS

Jury Sergeev in R (язык программирования)

т.е. представить, как оно будет выбираться с диска, что пойдет первым, что вторым с точки зрения увеличения детализации

источник

13:03пожаловаться #12

JS

Jury Sergeev in R (язык программирования)

конечно, неприятно что могут быть сильно разные запросы и мега-оптимально для всех не сделать, но если что уж - можно и еще таблицу-копию сделать, с другим партиционированием, грубо, но сработает... но места много надо, да

источник

13:04пожаловаться #13

ЭА

Эдик Амперян... in R (язык программирования)

Артём Клевцов

Себя он не любит 😁 Надо просто пересилить чуток, а потом уже не оттащишь.

Чтобы пересилить - есть полезный пост:
https://atrebas.github.io/post/2019-03-03-datatable-dplyr

По крайней мере, мне зашло недавно

источник

15:18пожаловаться #14

JS

Jury Sergeev in R (язык программирования)

Эдик Амперян

Чтобы пересилить - есть полезный пост:
https://atrebas.github.io/post/2019-03-03-datatable-dplyr

По крайней мере, мне зашло недавно

полезная ссылка какая, чую - будет еще попытка перейти на data.table )

источник

15:21пожаловаться #15

ЭА

Эдик Амперян... in R (язык программирования)

Тот факт, что я пока в DT "ковыляю", немного компенсировался мгновенностью операций над небольшим датасетом (300К строк, 140 переменных)

источник

15:24пожаловаться #16

JS

Jury Sergeev in R (язык программирования)

а мне пока мешает высокая скорость быстрого-наспех-анализа через dplyr, тут он хорош (пока не силен в data.table), просто не думаешь - сразу получаешь нужное... правда, долго ждать - если данных много )

источник

15:25пожаловаться #17

AS

Alexander Semenov in R (язык программирования)

Хреновые пользователишки попались Гадли. Человек старается, а в ответ...

источник

15:46пожаловаться #18

AS

Alexander Semenov in R (язык программирования)

Это я решил поинтересоваться, что за херню мне теперь стал выдавать dplyr: "summarise() ungrouping output (override with .groups argument)"

источник

15:47пожаловаться #19

AS

Alexander Semenov in R (язык программирования)

а мне пока мешает высокая скорость быстрого-наспех-анализа через dplyr, тут он хорош (пока не силен в data.table), просто не думаешь - сразу получаешь нужное... правда, долго ждать - если данных много )

+100 к "не думаешь". Не до этого как-то.

источник

15:49пожаловаться #20