2013-05-05 43 views
1

我正在研究文本挖掘問題:從文本中提取位置。這個地方可能只是州或者更具體的例如芝加哥街區的名字,甚至是一個特定的地址。但它只在美國。從文本中挖掘位置

我一直在嘗試雅虎Place Maker API,但我無法創建API密鑰(網站沒有響應)。無論如何,如快速礦工,還是寫一個綜合的正則表達式?

+2

正則表達式不會爲此工作,看看這裏:http://stackoverflow.com/questions/9397485/regex-street-address-match – 2013-05-05 22:55:17

回答

1

考慮斯坦福命名實體識別器(NER)。在線演示在這裏:

http://nlp.stanford.edu:8080/ner/process

這是一個Java庫。許可證是GPL v2,但在獨立應用程序中分發的許可證價格昂貴。

+0

反正有沒有使用rapidminer這個目的? – 2013-05-15 21:15:08

+1

有RapidMiner的信息抽取插件,但我已經嘗試了幾次,並沒有真正理解它。 – 2013-05-15 21:31:28