2011-07-24 60 views
0

我們遇到成員嘗試註冊多個帳戶以利用推薦獎勵和免費試用獎勵的問題。我們需要一個郵寄地址,並根據USPS進行驗證,但發現這仍然不能提供足夠的保護,並且對於用戶更改像「第2行」那樣的地址的元素並且仍然有效仍然太容易。檢測郵寄地址相似度

如果一個不同的用戶已經註冊了一個地址,最好的方法是什麼?

地址變化的例子:

59格蘭特大道 樓2

59格蘭特大道 套房2

與任何類似的確切比較的問題是,一個街道地址可能有多個租戶在不同的公寓/辦公室等

我們正在使用Rails 3,MySQL,Memcache,Sphinx

回答

1

雖然處於不同的環境中,但我們仍面臨類似的問題。沒有那麼多你可以做的,我們基本上寫了一種方法,試圖根據規範化的電話號碼,規範化的街道地址,Leveshtein distance的名稱和地址,地理編碼地址時的物理距離等來識別可能的重複。重複仍然需要一個人,但至少可以顯着減少可能的候選人的數量。

+0

我認爲可能是這種情況。我們還沒有嘗試Leveshtein距離,所以也許這是下一步。 – chrishomer

0

它需要智能來可靠地做到這一點,所以你可以忘記算法。我認爲你可以做的最好的是報告與已經提交的地址類似的地址,然後將其留給一個人來決定。