我有一個將存儲和跟蹤訪問者的應用程序。這些訪問者在設置訪問時根據需要由調度程序(用戶)在系統中創建。問題是,大部分的時間是訪問者的唯一重要的唯一標識符如下:名稱匹配字典,用於查找名字和姓氏變體
- 名
- 姓
- 公司名稱
的重複記錄現有風險因爲同一個人是固有的,調度人員可以輸入一個新的訪問者記錄來替代爲該名稱存在的人搜索系統。
當我遇到有人以同樣的名字進入一個訪問者時,我會顯示一個警告對話框,提供這個人可能是誰的各種建議,但是即使那樣也不夠好。
我可以輸入'Jim Jones',這個人可能在系統中存在'詹姆斯瓊斯'或'吉米瓊斯'。我看到有可用的名稱識別軟件包,但它們很昂貴,而且肯定比我所尋找的要重。
有人會知道在哪裏可以找到一個免費或開源詞典文件,我可以通過編程方式訪問以查找潛在的名稱變體?軟件或在線服務會很好,但即使只是一個數據轉儲或簡單的文本文件也可以。
我知道即使這不會阻止重複的訪客記錄,我只是試圖保持在最低限度,所以它不是一個關鍵功能。
我想從上面的設計說明中澄清一下,當我說一個調度程序可能會輸入一個新的訪客記錄來代替搜索系統時,我的意思是說這種行爲是通過設計的。用戶羣將被假定爲具有最小的計算機技能,因此需要乾淨簡單的手持流量。 – 2011-05-06 12:47:56