2012-05-11 45 views
3

感謝Google提供BigQuery,這太棒了!
近似字符串匹配/模糊字符串使用BigQuery搜索可能嗎?
Google是否有計劃將此功能添加到BigQuery?是否可以使用BigQuery進行近似字符串匹配/模糊字符串搜索?

當然,Google專有的近似字符串匹配算法可用於將此功能提供給BigQuery,同時仍保留Google知識產權。我們已經搜索了所有BigQuery文檔和Stack Overflow問題。當然,有很多算法可以做到這一點,但如何與BigQuery集成?

我們的需求很簡單,比較兩個字符串,雖然可能略有不同,但它們大都相同。例如:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC". 

從我們的BigQuery測試中,它出現兩個字符串需要精確匹配的BigQuery加入他們的行列,甚至下降到每個後面的空格的數量。爲了與BigQuery集成,添加此功能或指導將不勝感激。這是在密爾沃基噴氣機公司的支持下,密爾沃基噴氣機公司是一家位於美國威斯康星州密爾沃基市的地區性創新零部件噴氣公司。再次感謝Google提供BigQuery。

非常感謝和問候, 安德魯Paullin (414)212-5372

回答

4

不幸的是,不支持近似字符串匹配。你能得到的最接近的是使用正則表達式。您最好的選擇可能是在數據到達BigQuery之前對數據進行規範化處理,即將「Rhodes USA」和「Rhodes,USA」轉換爲相同的字符串。不過,我會爲此支持添加功能請求錯誤。