Size: a a a

R (язык программирования)

2021 June 21

Ю

Юрий 🐙💻🤖📊📈🚬... in R (язык программирования)
Читаем правила чата в закрепе
источник

AS

Alexey Seleznev in R (язык программирования)
На stepic есть курс анализ данных на языке R часть 2, там весь третий модуль посвящен rmarkdown
источник

К

Кирилл in R (язык программирования)
привет
источник

К

Кирилл in R (язык программирования)
а кто сечет в функции findoverlaps?
источник

К

Кирилл in R (язык программирования)
это из Granges
источник
2021 June 22

a

aGricolaMZ in R (язык программирования)
Поищите поиском по сайту, я скидывал свои материалы
источник

К

Кирилл in R (язык программирования)
Ребят еще раз привет! такая проблема: Есть датафрейм, в нем много данных. Во всех колонках кроме одной(value.sample) значения одинаковые. Мне нужно по колонке amplicon (AMPL273008565) сделать медиану по значениям value.reference и потом, так как далее все значения одинаковы и отличаются только по amplicon и value.reference, убрать дублирующийся строки.
head(ATRX[,c(1:6,17,18,22)])
 gene MeanRatio LowerBoundBoot MeanBoot UpperBoundBoot LowerNoise value.sample value.reference      amplicon
1 ATRX      0.49           0.25     0.49           0.85       0.87     165.3665        130.9586 AMPL273008565
2 ATRX      0.49           0.25     0.49           0.85       0.87     165.3665        130.4527 AMPL273008565
3 ATRX      0.49           0.25     0.49           0.85       0.87     165.3665        157.8846 AMPL273008565
4 ATRX      0.49           0.25     0.49           0.85       0.87     165.3665        123.4716 AMPL273008565
5 ATRX      0.49           0.25     0.49           0.85       0.87     165.3665        128.0494 AMPL273008565
6 ATRX      0.49           0.25     0.49           0.85       0.87     165.3665        146.0372

количество уникальных значений по колонке ампликон - 105
unique(ATRX$amplicon)
 [1] "AMPL273008565" "AMPL274078084" "AMPL274087077" "AMPL274093861" и так далее до 105

По остальным кроме value.reference - 1
unique(ATRX$MeanRatio)
[1] 0.49

По факту получается мне надо высчитать медиану, что делается через dplyr -
by_multiple <- ATRX %>%
 group_by(amplicon) %>%
 summarise(count= mean(value.reference))
Но он создает таблицу с медианой по ампликону. и я не понимаю как дальше удалить дупликаты в основной таблице и присоединить к ней результат по медианам
источник

PU

Philipp Upravitelev in R (язык программирования)
приложите семпл датасета и код, иначе понять, в чем проблема, достаточно сложно
источник

К

Кирилл in R (язык программирования)
в каком виде приложить?
источник

К

Кирилл in R (язык программирования)
ага
источник

К

Кирилл in R (язык программирования)
бритва пишет щас мне скажет
источник

К

Кирилл in R (язык программирования)
двай в личку
источник

PU

Philipp Upravitelev in R (язык программирования)
csv, rds, что угодно
источник

IS

Ilya Shutov in R (язык программирования)
Кирилл, на конкретный вопрос куда проще получить ответ. Чем не устроил https://rdatatable.gitlab.io/data.table/reference/foverlaps.html?
источник

IS

Ilya Shutov in R (язык программирования)
Кстати, красивая публикация была: https://habr.com/ru/post/547448/
источник

А

Анатолий in R (язык программирования)
Спасибо! Попробую буду осваивать.

Кстати,  fread заработал "по кусочкам".  Оказалось достаточно минимальный объем виртуальной памяти поставить больше объёма файла данных.
источник

DK

Dm Kb in R (язык программирования)
прочитал статью, но для себя не изменил мнение, что data.table и fst для анализа будут всегда выигрывать у таких БД по скорости, да и по синтаксису, но последнее на любителя видимо
источник

IS

Ilya Shutov in R (язык программирования)
речь не идет о выигрыше. хороший подход, который позволяет и упомянутую задачу решить тоже

можно другую БД сюда поставить.
источник

БА

Байкулов Антон... in R (язык программирования)
Согласен. Полезно
источник

БА

Байкулов Антон... in R (язык программирования)
Вопрос наверное в том, какие задачи решать. Если для небольшого приложения на шайни или каких-то информационных панелей, то наверное это один з лучших вариантов
источник