請考慮以下示例數據框。另一列的唯一值的一列的唯一值
> ww
col1 col2
1 1 A
2 2 A
3 3 A
4 4 B
5 5 B
6 6 B
7 7 C
8 8 C
9 9 C
> dput(ww)
structure(list(col1 = c(1, 2, 3, 4, 5, 6, 7, 8, 9), col2 = structure(c(1L,
1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L), .Label = c("A", "B", "C"), class = "factor")), .Names = c("col1",
"col2"), row.names = c(NA, -9L), class = "data.frame")
我想知道如果col2
每個類別有col1
與否不同的值。最後,我想得到一個答案(TRUE或FALSE)。 TRUE(如果col2
所有類別具有在col1
完全不同的值的集合),和FALSE(如果存在至少2個類別中col2
具有在col1
常見。
對於上面的例子ATLEAST 1個值,答案是因爲類別TRUE A,B和C的col1
沒有任何值,因爲它們是相同的,col1
的值對於A是1,2,3。col1
的值對於B是4,5,6。col1
的值是7,8,9對於C.
我可以嘗試將數據幀的數據拆分col2
,然後爲每個成員保存col1
的值,然後使用檢查常用值但是對於大型數據框而言,這是一種漫長而低效的過程。有人可以爲我提供有效的解決方案嗎?任何數據表解決方案也可以。
你可以使用'duplicateated'來查看是否有重複。我假設兩行'1 A'和'1 A'是你想要創造虛假回報的情況。 'duplicateated'將返回重複的值(不包括原始值)。如果我理解,將它與'any'結合使用可以爲您提供所需的功能。 – giraffehere
'col2'的類別可以在'col1'中有重複的值,即A類有兩個1嗎?如果沒有,@giraffehere的建議是現貨。事實上,你想要使用'anyDuplicated' –