Size: a a a

R (язык программирования)

2021 May 22

DK

Dm Kb in R (язык программирования)
можно настроить
источник

AK

Anton Kovalev in R (язык программирования)
Вот странно!
источник

AK

Anton Kovalev in R (язык программирования)
Да! Это следующий шаг! Но я надеялся, что такой должен быть, по идее)
источник

DK

Dm Kb in R (язык программирования)
лично у меня не возникало желания его зашортакатить ))
источник

IS

Ilya Shutov in R (язык программирования)
Странное желание. Это редкий товарищ в коде, также часто используется и его коллега %chin%. Желание повесить на клавиши наводит на мысль о неправильности кода и алгоритма. Чем вызван этот вопрос?
Корректируется, скорее всего, join-ами.
источник

AK

Anton Kovalev in R (язык программирования)
Почему странное?!

Оператором присваивания Вы как пользуетесь?) пошагово?
Это просто удобно! Кусок в чанк обратить и тп!
Разве нет?
источник

IS

Ilya Shutov in R (язык программирования)
Если честно, ничего не понял из написанного. Можете пример кода привести, который мозоли натирает от %in%? Неясно откуда такая потребность в шорткате
источник
2021 May 23

М

Марк in R (язык программирования)
А я тоже постоянно юзаю %in%. Когда гружу из БД разные таблицы а данными по клиентам и проверяю наличие клиентов в них
источник

М

Марк in R (язык программирования)
Но горячей клавиши под него похоже реально нет, тоже искал
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Вопрос на миллион. Почему не проверять это на стороне БД?
источник

М

Марк in R (язык программирования)
БД не осилит одним запросом, когда нужно поработать с нескольким млн строк 🤷‍♂
источник

М

Марк in R (язык программирования)
Или когда бд несколько
источник

ДВ

Дмитрий Володин... in R (язык программирования)
А локальная сессия R осилит? Подумайте над оптимизацией запросов и ресурсов))
источник

М

Марк in R (язык программирования)
А почему нет?))
источник

М

Марк in R (язык программирования)
32 гб оперативы и  data.table
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Всё это очень странно. Правда, подумайте над архитектурой вашего аналитического стека. Предобработка данных должна проводиться в БД, R для сложных алгоритмов, статметодов, ml и визуализации
источник

IS

Ilya Shutov in R (язык программирования)
Все легко осилят на объемах до сотен гигов.
1. Если ищете character, то надо `data.table::%chin%`
2. Сетевое время для всего объема - первый тормоз. Обычно пишут параметризованный sql запрос и оборачивают в функцию. Нужны данные по персонажу - только их и тащим
3. Запрос про шорткат - явный признак про нелады в архитектуре. Лакмусовая бумажка
источник

М

Марк in R (язык программирования)
Спорить не могу, у меня мало опыта) Но когда 10 млн записей в таблице клиентов, десятки таблиц с данными о них, не все проиндексированы, часть данных лежит в двх на другом движке, есть админ бд, который ругается, что ты грузишь базу своими запросами - мне гораздо комфортнее всю обработку делать в R. Часть данных тяну запросами, часть гружу таблицы целиком и собираю то что мне нужно уже в R.

Тут же часть выгрузил, покрутил, посмотрел, график построил, дальше пошел.
источник

М

Марк in R (язык программирования)
Поэтому %in% я юзаю невероятно часто 😁
источник

IS

Ilya Shutov in R (язык программирования)
Это хороший сценарий, но, видимо, есть что усовершенствовать. Буквально «опросник из 10 пунктов», которые могут существенно улучшить конструкцию
источник