2011-11-11 48 views
0

我有這樣一個數據集:分組,計數以及選擇R上的數據集

x 
     A  B 
1  x  2 
2  y  4 
3  z  4 
4  x  4 
5  x  4 
6  x  3 
...... 

我想知道如果在此數據集都存在相同數目的「A」上比某些值(例如3 )。

可能是我需要組該值在臨時表中獲取這樣的:

X Y  z 
    4 1  1 

並在此之後,我將調用另一個方法(我不知道),這給了我這樣的結果

X

因爲在我以前的表中只有X的值超過3次。 R可以優化此操作嗎?

回答

1

數據< -data.frame(因子(C( 「X」, 「Y」, 「Z」, 「X」, 「X」, 「X」)),C(2, 4,4,4,4,3))

要獲得每個字母的計數,做

表(數據[1])

和得到因素名稱> 3

名(表(數據[1]))[表(數據[1])> 3]我的目的

1

不知道我是否理解你......對這個B列有什麼意見?

這是否適合您?

set.seed(1234) 
A <- sample(c("x", "y", "z"), 20, replace = TRUE) 
Ad <- data.frame(table(A)) 
with(Ad, A[Freq >= 7]) 
     [1] x y 
+0

-B柱上什麼 –

+0

我不THIK您的解決方案可以對我有用。 我的數據幀可以使用表()函數進行分組,所以我會得到這樣的結果: XYZ 但在此之後我需要得到列值(幾乎爲0或1值,該值匹配這種情況)發生> = 3(例如),在這種情況下,只有x是結果。 –

+0

我的理解是,這種說法似乎對我來說很好,我認爲它有一個特定的命令,但這對我來說應該很好。謝謝 –