我有一個數據框架叫做dataSet並且在那個data.frame中我希望能夠引用一個值一個特定的列(因爲它是一個重複的值)並按每個值彙總/總計總和。R:想要按列中的值聚合(總計和整個案例的總數)
我知道我可以調用特定的列。例如,要調用第四列數據,我會使用這個。
dataSet[,4]
如果數據集是這樣的:
col1 col2 col3 col4
3 6 2 1
5 2 6 2
5 6 12 3
4 3 NA 4
5 2 NA 3
7 6 NA 1
6 6 19 4
9 3 2 1
我希望能夠聚集(GROUP BY,對於那些你們誰知道SQL)的COL4值。
一,(我選擇任何一列)的總和,說COL4在這種情況下。但理想情況下,我可以將列作爲變量並從任何列中調用值。
所以我會爲總和 COL1答案爲COL4的每個公共價值,像這樣:
col1 col4
19 1
5 2
10 3
10 4
二,完成案件的數量,作爲標誌着由「數量」一欄。
count col4
2 1
1 2
1 3
1 4
作爲R的新手,我發現如何在列中引用(或調用)特定值是很困難的。我有一個dataframe [i,j]的參考部分,其中i = row,j = col。我想一個三級的問題是,我在哪裏可以瞭解更多關於如何使列和值引用(或電話)到R內的所有對象(例如列表,data.frames)
我不太清楚這是走向的方向。下面的答案符合我正在尋找的方向。一個用於根據col4對一列(Col1)進行求和。 第二部分將計算complete.cases。 – Paul
這就是你用這些方法得到的結果。去嘗試一下。您的計數可能不正確。試用@ samhiggins2001提出的表格解決方案和我的代碼。 –
這可能是我頭上的一點點(欣賞它雖然 - 拉伸我)。我無法在d1函數中獲得'd'。我假設這是我的目錄或data.frame是否正確? 我得到這個錯誤: – Paul