有誰能告訴我我在做什麼錯在這裏。我想測試將R包RecordLinkage的比較功能上的玩具集R包問題RecordLinkage
> test<-cbind(
+ a = c(1, 1, 1),
+ b = c(2, 0, 2),
+ c = c(1, 2, 1))
>
> test
a b c
[1,] 1 2 1
[2,] 1 0 2
[3,] 1 2 1
>
> results <- compare.dedup(test)
>
> results$pairs
id1 id2 a b c is_match
1 1 2 1 0 0 NA
2 1 3 1 1 1 NA
3 2 3 1 0 0 NA
>
記錄1和3清楚地匹配,但is_match是NA爲三對。
感謝
將在原始數據中指定'is_match'以顯示一對實際匹配。 'RecordLinkage'包主要用於測試連接算法,本專欄允許評估基準數據的算法。 –
謝謝理查德 - 我現在明白了。 - 但是,例如,如果我輸入頭(RLdata500),我沒有看到身份欄 - 它在哪裏? –
對於任何人來說,像我這樣的人都會遇到這樣的問題:在R中鍵入「help(RLdata500)」。它解釋了identity.RLdata500是一個分離定義的向量,它包含唯一的ID。 –