我有具有以下格式非數字值的數據幀:重塑一個數據幀中的R與非數值
DF1:
col1 col2
1 a b
2 a c
3 z y
4 z x
5 a d
6 m n
我需要將其轉換成這種格式,
DF2:
col1 col2 col3 col4
1 a b c d
2 z y x NA
3 m n NA NA
隨着COL1作爲主鍵(不知道這是R中的右術語) ,而其餘的列包含與該鍵相關的元素(如在DF1中所見)。
與DF1相比,DF2將包含更多列,具體取決於與任何鍵關聯的元素數量。
某些列將不具有由與每個鍵相關聯的不同數量的元素產生的值,表示爲NA(如DF2中所示)。
列名可以是任何東西。我試圖使用reshape(),melt()+ cast(),甚至是一個泛型for循環,我使用cbind並嘗試刪除該行。
它是超過5000萬行的非常大的數據集的一部分。我可能不得不爲這項任務使用雲服務,但這是一個不同的討論。
我是R的新手,所以可能會有一些明顯的解決方案,我錯過了。
任何幫助將不勝感激。
-Thanks
什麼是你想怎麼第二個安排在邏輯關於第一? – alistaire
'dd $ time < - ave(seq_along(dd $ col1),dd $ col1,FUN = seq_along); reshape(dd,dir ='wide',idvar ='col1',timevar ='time',v.names ='col2')' – rawr
編輯以解釋更多關於2個數據幀之間的關係 –