Ребят еще раз привет! такая проблема: Есть датафрейм, в нем много данных. Во всех колонках кроме одной(value.sample) значения одинаковые. Мне нужно по колонке amplicon (AMPL273008565) сделать медиану по значениям value.reference и потом, так как далее все значения одинаковы и отличаются только по amplicon и value.reference, убрать дублирующийся строки.
head(ATRX[,c(1:6,17,18,22)])
gene MeanRatio LowerBoundBoot MeanBoot UpperBoundBoot LowerNoise value.sample value.reference amplicon
1 ATRX 0.49 0.25 0.49 0.85 0.87 165.3665 130.9586 AMPL273008565
2 ATRX 0.49 0.25 0.49 0.85 0.87 165.3665 130.4527 AMPL273008565
3 ATRX 0.49 0.25 0.49 0.85 0.87 165.3665 157.8846 AMPL273008565
4 ATRX 0.49 0.25 0.49 0.85 0.87 165.3665 123.4716 AMPL273008565
5 ATRX 0.49 0.25 0.49 0.85 0.87 165.3665 128.0494 AMPL273008565
6 ATRX 0.49 0.25 0.49 0.85 0.87 165.3665 146.0372
количество уникальных значений по колонке ампликон - 105
unique(ATRX$amplicon)
[1] "AMPL273008565" "AMPL274078084" "AMPL274087077" "AMPL274093861" и так далее до 105
По остальным кроме value.reference - 1
unique(ATRX$MeanRatio)
[1] 0.49
По факту получается мне надо высчитать медиану, что делается через dplyr -
by_multiple <- ATRX %>%
group_by(amplicon) %>%
summarise(count= mean(value.reference))
Но он создает таблицу с медианой по ампликону. и я не понимаю как дальше удалить дупликаты в основной таблице и присоединить к ней результат по медианам