Size: a a a

R (язык программирования)

2020 July 28

GS

Gleb Suvorov in R (язык программирования)
источник

GS

Gleb Suvorov in R (язык программирования)
все равно медленнее)
источник

э

эдуард in R (язык программирования)
да, офк
источник

э

эдуард in R (язык программирования)
дата тейбл никто не переплюнет
источник

AB

Alexey Burnakov in R (язык программирования)
Александр
Расскажите о результатах, практические кейсы всегда интереснее
Ага, потом выложу. Я делаю свою наколенную логику отбора. Сравним OOS ошибку
источник

A

Andrey in R (язык программирования)
эдуард
а вот нумпай за 150мс
np_arr.min(axis=1)
У меня 10кк numpy считает за 640 мс, data.table в 8 потоков - 200-220 мс.
источник

A

Andrey in R (язык программирования)
что там у numpy с многопоточностью? Внутри же c++, должен уметь
источник

A

Andrey in R (язык программирования)
Ради интереса можно еще с numba сравнить, насчет многопоточности .min() есть сомнения
источник

IS

Ivan Struzhkov in R (язык программирования)
вообще конечно я всегда халявил - синтаксис дата тейбла знаком - но все сложные вещи делал на стороне сервера в SQL - а тут вот пришлось и конечно на крупных датасетах с мелкой группировкой тайди прям не блещет
источник
2020 July 29

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Philipp Upravitelev
коллеги, а никто не видел какие-нибудь онлайн-песочницы, где можно поиграться с разными версиями R?
источник

AP

Anton Pysanka in R (язык программирования)
Дмитрий Володин
Коллеги, привет. Мои приключения со связкой R+MSSQL продолжаются. С помощью RODBC прочитал таблицу без проблем, которую не мог прочитать через DBI. А вот записать в неё не могу. Ни sqlSave, ни sqlUpdate. Ошибки разные. Если записывать as is, без изменения типов данных под колонки таблицы в БД, - вообще из сессии выкидывает, если типы привести в соответствие, - то пишет cannot update without unique column (просит PK?). Пришлось писать дикий костыль на формирование INSERT SQL запроса. Stackoverflow советует так; другие советы оттуда не дали результата. Есть ли вариант без вот этого костыля с формированием запроса в скрипте и отправки этой строки в БД? ПС. До этого таблица обновлялась в питоне тупо через pandas.to_sql с указанием dtype. Сейчас захотелось всё перевести в R, а именно попробовать загрузку через plumber.
читайте при помощи RODBC, а записывайте DBI-ем, попробуйте)
источник

ДВ

Дмитрий Володин... in R (язык программирования)
Anton Pysanka
читайте при помощи RODBC, а записывайте DBI-ем, попробуйте)
Нет, до RODBC пробовал как раз через DBI писать. Также невозможно
источник

AP

Anton Pysanka in R (язык программирования)
Дмитрий Володин
Нет, до RODBC пробовал как раз через DBI писать. Также невозможно
почему невозможно, что не так происходит как надо?
источник

ДВ

Дмитрий Володин... in R (язык программирования)
До работы доберусь - воспроизведу ошибку. Если память не изменяет, то такая же проблема, как и при чтении: invalid descriptor index
источник

AS

Alexey Seleznev in R (язык программирования)
Дмитрий Володин
Коллеги, привет. Мои приключения со связкой R+MSSQL продолжаются. С помощью RODBC прочитал таблицу без проблем, которую не мог прочитать через DBI. А вот записать в неё не могу. Ни sqlSave, ни sqlUpdate. Ошибки разные. Если записывать as is, без изменения типов данных под колонки таблицы в БД, - вообще из сессии выкидывает, если типы привести в соответствие, - то пишет cannot update without unique column (просит PK?). Пришлось писать дикий костыль на формирование INSERT SQL запроса. Stackoverflow советует так; другие советы оттуда не дали результата. Есть ли вариант без вот этого костыля с формированием запроса в скрипте и отправки этой строки в БД? ПС. До этого таблица обновлялась в питоне тупо через pandas.to_sql с указанием dtype. Сейчас захотелось всё перевести в R, а именно попробовать загрузку через plumber.
источник

E

EK479 in R (язык программирования)
здравствуйте! на kaggle часто вижу график такого типа. Имеет ли вообще смысл строить точечный график для факторной переменной и количественной? Разве не лучше в таком случае применить boxplot, например?
источник

A

Andrey in R (язык программирования)
http://www.sthda.com/sthda/RDoc/figure/easy-ggplot2/ggplot2-violin-plot-demo.png вот такое лучше всего использовать
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Andrey
http://www.sthda.com/sthda/RDoc/figure/easy-ggplot2/ggplot2-violin-plot-demo.png вот такое лучше всего использовать
С поправкой: только при маленькой численности выборки на каждую градацию фактора, при большем n наглядность потеряется
источник

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
EK479
здравствуйте! на kaggle часто вижу график такого типа. Имеет ли вообще смысл строить точечный график для факторной переменной и количественной? Разве не лучше в таком случае применить boxplot, например?
Как уже отметили: не имеет, но очень часто встречается
источник

E

EK479 in R (язык программирования)
Юрий 🐙💻🤖📊📈🚬
С поправкой: только при маленькой численности выборки на каждую градацию фактора, при большем n наглядность потеряется
спасибо)
источник