如何找到某個特定行與數據框中其餘行之間的最佳相似性?如何在R中找到1行與其餘數據框之間的最佳相似性?
我試着解釋我的意思。看看這個數據幀:
df <- structure(list(person = 1:5, var1 = c(1L, 5L, 2L, 2L, 5L), var2 = c(4L,
4L, 3L, 2L, 2L), var3 = c(5L, 4L, 4L, 3L, 1L)), .Names = c("person",
"var1", "var2", "var3"), class = "data.frame", row.names = c(NA,
-5L))
如何找到在數據幀人1(第1行)和行(人)的其餘部分之間的最佳相似。輸出應該是這樣的:人1仍然在第1行,其餘的行按照最相似的順序排列。我想使用的相似度算法是餘弦或皮爾森。我試圖用arules package
的函數來解決我的問題,但它與我的需求不匹配。
任何想法的人?
謝謝!不錯的方法 – rdatasculptor