我對R相對比較陌生,不知道如何解釋我的問題。基本上,我有一個數據幀test
看起來像:摺疊獨特的行,但在R中保留一個變量
PMID PL subject
1 Canada neurology
2 USA cancer
5 Canada dermatology
2 USA respiratory
4 Japan neurology
2 USA cancer
5 Canada cardiovascular
,我想轉換成
PMID PL subject
1 Canada neurology
2 USA cancer, respiratory
5 Canada dermatology, cardiovascular
4 Japan neurology
在本質上,每個PMID可以關聯到多個學科,所以我要保留這些信息。我只想要唯一的PMID行。然而,我也希望刪除重複出現的內容(例如,有3行「2」,但其中2個是「癌症」)。另外,我還有其他變量,每個PMID對於其他變量都具有相同的值變量(除主題)。
請指教。
謝謝!
您好另一種選擇,我更新了我的數據集,我的問題。我實際上有2個以上的變量,你的代碼只保留了兩個變量,並排除了其他變量(在同一個PMID中是不變的) – sweetmusicality
@sweetmusicality檢查我更新的答案。 – Wen
非常感謝:)它的作品! – sweetmusicality