2012-11-27 75 views
8

我有一個可愛的數據框,我的第一個,我開始得到R的坑。我一直沒能找到的是重複值的測試。我有一欄,我很確定所有的獨特價值,但我不知道。找出R表中的列是否包含重複值?

有沒有我可以問的方法?爲簡單起見,我們假設這是我的數據:

var1 var2 var3 
1 1 A 1 
2 2 B 3 
3 3 C NA 
4 4 D NA 
5 5 E 4 

,我想知道是否var1不斷重複。

回答

10

退房的duplicated功能:

duplicated(dat$var1) # the rows of dat var1 duplicated 

文檔是here

您還應該看看unique函數。

+3

該文檔還提到'anyDuplicated'可能更直接相關。 – joran

+0

@Joran應該指出'any(duplicated(dat $ var1))'會給出一個T/F值,其中'anyDuplicated(dat $ var1)'會給出一個索引/ 0值。 –

+0

anyDuplicated它。所以現在事實證明'anyDuplicated(j)'返回2039,這正是'anyDuplicated(j $ should_be_unique)'返回的結果。這是81,000個記錄中的一個。我可以生成一個TRUE/FALSE的矩陣對象,但無法檢查這些2039中的一些。新問題? – Amanda

相關問題