我有一個數據框有兩列,一個用於基因符號,另一個用於功能途徑。通路列具有重複值,因爲每個通路都有許多基因。我想對這個數據集進行重新排序,以便每列都是單一的路徑,這些列中的每一行都是屬於該路徑的基因。轉置與重複數據幀
開始數據幀:
data.frame(pathway = c("p1", "p1", "p1", "p1", "p2", "p2", "p2"),
gene.symbol = c("G1", "G2", "G3", "G4", "G33", "G43", "G10"))
希望的數據幀:
data.frame(p1 = c("G1", "G2", "G3", "G4"), p2 = c("G33", "G43", "G10",
""))
我知道,並不是所有的列將是相同的長度,並且具有空白值優選到NAS。
由於列將不具有相同的長度,你真的最好創建一個標準的'list'而不是'data.frame',特別是因爲第1行第1列與第1行第2列無關。 –