-5
我們有一個貢獻者的數據庫。貢獻者信息從多個來源導入。每次貢獻幾次並輸入他們的名字。一些貢獻者拼錯了他們的名字。要求是找出每個貢獻者的貢獻總額。我們嘗試了SQL Soundex和Metaphone 3. Soundex不準確,而且Metaphone 3太耗時。有沒有更好的方法來解決這個問題?通過類似的探測姓名
實例:
的Sql的Soundex
select soundex('Opacinch') returns O125
select soundex('Opancinch') returns O152
音位3
音位3使用排名算法。每個記錄應該與所有記錄進行比較,這導致太多的組。如果我們使用等級2,以下所有記錄將被視爲相同
Chandaprakash
Chandaprakas
Chandapraka
Chandaprak
Chandapra
Chandapr
Chandap
Chanda
Chand
Chan
Cha
Ch
C
是 - 更改表格設計。聽起來很可怕。 –
你怎麼知道'Vivk'和'Vivek'是同一個貢獻者?按照@juergend的建議。 – tima
如果您沒有通過「不準確」(顯示輸入和預期和實際匹配)和「太耗時」(提及基準)來指定您的意思,我們無法幫助您。正如目前所述,這個問題被解釋爲「將你最喜歡的全文搜索算法拋給我,我會弄清楚它是否滿足我未公開的要求」,這不是這個網站的工作原理。 – CodeCaster