Коллеги, немного туплю, такой вопрос.
Сделал PCA, хочу выделить переменные с наибольшими по модулю нагрузками (loadings) на каждую главную компоненту (principal components). Проблема в том, что переменных очень много (~5000) и PCs очень много (~100). То есть я хочу для каждой PC получить топ-10 переменных по нагрузке на эту PC (ну и самое значение нагрузки тоже).
Данные выглядят вот так. То есть для каждой PC1, PC2 и тд нужно найти какие groups_ имеют наибольшую нагрузку (значение ячеек на скрине).