2017-08-10 62 views
-5

我們有一個貢獻者的數據庫。貢獻者信息從多個來源導入。每次貢獻幾次並輸入他們的名字。一些貢獻者拼錯了他們的名字。要求是找出每個貢獻者的貢獻總額。我們嘗試了SQL Soundex和Metaphone 3. Soundex不準確,而且Metaphone 3太耗時。有沒有更好的方法來解決這個問題?通過類似的探測姓名

實例:

的Sql的Soundex

select soundex('Opacinch') returns O125 
select soundex('Opancinch') returns O152 

音位3

音位3使用排名算法。每個記錄應該與所有記錄進行比較,這導致太多的組。如果我們使用等級2,以下所有記錄將被視爲相同

Chandaprakash 
Chandaprakas 
Chandapraka 
Chandaprak 
Chandapra 
Chandapr 
Chandap 
Chanda 
Chand 
Chan 
Cha 
Ch 
C 
+5

是 - 更改表格設計。聽起來很可怕。 –

+0

你怎麼知道'Vivk'和'Vivek'是同一個貢獻者?按照@juergend的建議。 – tima

+0

如果您沒有通過「不準確」(顯示輸入和預期和實際匹配)和「太耗時」(提及基準)來指定您的意思,我們無法幫助您。正如目前所述,這個問題被解釋爲「將你最喜歡的全文搜索算法拋給我,我會弄清楚它是否滿足我未公開的要求」,這不是這個網站的工作原理。 – CodeCaster

回答

0

從您的「名稱」表中填充DropDownList。這樣每個人只能選擇他的名字,不會被允許輸入不同的拼寫。

+0

用戶沒有使用我的應用程序來填充。他們提交這個信息的excel文件。 –