0

我們的應用程序允許用戶輸入其組織使用的公司名稱。目前的問題是,一個用戶輸入公司名稱的方式因用戶而異。我們需要整合這些數據。有解決這個問題的方法嗎?合併/羣集術語和短語

回答

1

數據質量問題通常被稱爲數據清理。這方面有很多方法和工具。

最適合你的將取決於你的問題的程度以及你使用的技術。但是如果我理解的很好,那麼存儲的數據就OK了,問題是用戶輸入的數據是否與拼寫錯誤一起搜索?在這種情況下,模糊搜索可能有幫助

+0

模糊搜索是有道理的,你有什麼建議,至於工具? – Rob 2009-12-22 09:08:56

+0

您正在使用哪種技術? – ewernli 2009-12-22 12:21:04

+0

非常標準的.net/sql堆棧。目前使用全文查詢,但這並沒有多大幫助。 – Rob 2010-05-06 15:35:15