Size: a a a

R (язык программирования)

2020 September 27

A

Andrey in R (язык программирования)
аналог scikit learn - только mlr3. tidymodels внешне не так похож, хотя решает те же задачи. caret - уже история
источник

АК

Артём Клевцов... in R (язык программирования)
Andrey
спасибо; есть один нюанс с моими данными. Там одно поле имеет вид {100500, 1234, 999} и разделитель между полями тоже запятая. Нормально такие вещи проходят?
Сходу не скажу, надо тестировать. Если оно закавычено, авось прожуёт.
источник

A

Andrey in R (язык программирования)
В кавычках, проверил, буду пробовать Apache Drill. А вот Пентаха платная оказалась...
источник

АК

Артём Клевцов... in R (язык программирования)
Ещё вариант. Распили файл в баше и перелей в паркет через R arrow. man split.
источник

A

Andrey in R (язык программирования)
split тоже использовал, ну и csvkit в итоге зарешал. Больше никуда не конвертировал, т.к. был готовый код, делающий выжимку размером 1 Гб из всех исходников. Это я уже на будущее смотрю, как можно проще и консистентнее делать
источник

АК

Артём Клевцов... in R (язык программирования)
readr::read_csv_chunked + arrow::write_parquet должен быть не плох.
источник

JS

Jury Sergeev in R (язык программирования)
Andrey
В кавычках, проверил, буду пробовать Apache Drill. А вот Пентаха платная оказалась...
Не ту скачал, нужна community edition, с source forge  бери
источник

JS

Jury Sergeev in R (язык программирования)
источник
2020 September 28

EP

Ed P in R (язык программирования)
Юрий 🐙💻🤖📊📈🚬
Это шутка? В России ничего нету
слишком дерзко) В СПбГУ как минимум была кафедра биостатистики
источник

EP

Ed P in R (язык программирования)
Даже какие-то свежие лекции постят:
https://sites.google.com/site/malovsergvas/obavlenia-1/biostatistika-bioinformatika-spbgu

М.б. у них можно спросить насчет последипломного образования / курсов повышения квалификации. Главное не перепутать с "Медицинской статистикой" - это совсем другое
источник

A

Andrey in R (язык программирования)
Jury Sergeev
Не ту скачал, нужна community edition, с source forge  бери
Понял, я че-то решил, что там совсем неактуальная версия
источник

АК

Артём Клевцов... in R (язык программирования)
Переслано от Артём Клевцов...
источник

JS

Jury Sergeev in R (язык программирования)
о, fst тоже columnar, надо почитать, спасибо
источник

АК

Артём Клевцов... in R (язык программирования)
Пост слегка устарел. В гитхаб репе есть более свежие данные, но там почему-то нет варианта R arrow без конвертации в/из R data.frame, хотя аналогичный вариант для питона присутствует и рвёт всех.
источник

JS

Jury Sergeev in R (язык программирования)
жаль
источник

a

aGricolaMZ in R (язык программирования)
Спасибо!
источник

АК

Артём Клевцов... in R (язык программирования)
Jury Sergeev
жаль
Код есть, можно попробовать воспроизвести. Только файлов исходных данных там нет.
источник

EP

Ed P in R (язык программирования)
Cytel ищет сеньоRа:
https://www.linkedin.com/jobs/view/senior-r-r-shiny-data-visualization-developer-at-cytel-2025033325/

Поскольку Cytel в РФ тоже есть, то с учетом remote м.б. и не только на американских кандидатов смотрят.
источник

PU

Philipp Upravitelev in R (язык программирования)
вы смотрите, что в соседнем чате принесли
программа европейского университета и яндекса. по анализу данных. в R.
https://pandan.eusp.org
источник

БА

Байкулов Антон... in R (язык программирования)
И программа у них интересная
источник