2015-11-16 68 views
1

這裏的問題是:如何從字符串中獲取地址?

比方說,我們已經有了字符串如"Some restaurant is located at 750 17th St NW, Washington, DC 20006 and it's opened at 8am"

任務是獲取地址了這樣的字符串。所以切割部分應該是:750 17th St NW, Washington, DC 20006。但是 - 沒有固定的地址格式,沒有關於它的規則。任何對任何地圖服務都準確的地址應視爲地址。它也可以像:

"at 750 17th St NW, Washington, DC 20006 there is some restaurant and it's opened at 8am" 

"there are many restaurants in Washington, DC" 

我的任務是讓地址出字符串,避免失控未解決的部分。我很快意識到這個問題非常複雜。我可以連接到一些地理編碼API,但是我發送的字符串仍然包含其餘的句子。

你們對這些問題有什麼想法或經驗嗎?

這裏實現的具體語言並不是很重要。

回答

0

如果地址在一個字符串中的位置是未知的,但地址是可以格式化的,那麼你可以想出一些正則表達式的解決方案。

如果地址格式真的可能發生變化並且正則表達式不夠,那麼監督式學習就是解決方案。

+1

我很想聽聽你要寫一個匹配所有預期種類的地址/位置描述的正則表達式...... – DarkDust