2017-04-26 19 views
0

我已成功地使用tokensregex進行基於規則的命名實體識別,但希望通過將地名詞典添加爲附加圖層來提高準確性。如何使用Tokensregex的地名詞典?

我的數據實際上並不在文件中,但是在一張如下所示的地圖中: {「China」= [「shanghai」,「Beijing」,「Gonzo」,「...」,「United Kingdom」= [「倫敦」,「曼徹斯特」,「愛丁堡」,...]}其中關鍵是國家名稱和價值是相應的城市。

  1. 我可以使用這種格式即地圖或做我需要與位置名稱和位置標籤的TSV文件?

  2. 如何在tokensregex中使用地名詞典註釋?

  3. 此外,由於tokesnregex一次只查看一個標記,我如何在地名詞典中匹配紐約這樣的多個標記詞?

回答