2012-11-11 52 views
0

我在解析RSS提要,尋找對國家的引用。目前我正在使用Python,但我認爲這個問題相當語言不可知(理論上)。用於查詢的數據存儲

比方說,我有三個列表(所有相關的)

  • 國家 - 名詞(即英格蘭,挪威,法國)
  • 國家 - 形容詞(即英語,挪威語,法語)
  • 城市(即倫敦,紐卡斯爾,伯明翰)

我的目標是從解析這些字符串的提要開始。

因此,舉例來說,如果「倫敦」中發現,該國將成爲「英格蘭」,如果「挪威」,發現這將是「挪威等

什麼將是這個工作的最佳方法數據?它會不會是傑森,並將其全部用於創建嵌套字典?套?或某種類型的數據庫?

目前這隻適用於本地機器。

回答

0

這是一個非常值得商榷的問題。可以有多種解決方案。如果我是你,我只想在MongoDB中一個小DB三和用表像這些

  1. 國家: 列:ID,名稱
  2. 國家-ADJ: 列:ID,姓名,COUNTRY_ID
  3. 城市: 列:id,name,country_id

然後簡單的查詢會給你想要的結果。

0

我建議將3個數據列表合併到一個字典中,該字典將名稱映射到國家名稱,例如,它映射"England" -> "England""English" -> "England""London" -> "England"。它可以很容易地存儲在數據庫或文件中並進行檢索。

然後我會搜索詞典中的鍵,並用詞典中的值標記項目。