2011-02-25 54 views
1

我的應用程序有一個270萬條記錄表,其中包含世界上所有城市和村莊的列表(由GeoNames.org提供)。每個城市都有它的母語的名字。該數據庫將以自動完成形式進行搜索,但用戶應能夠使用自己的語言(主要是葡萄牙語,因爲這將是一個巴西網站)輸入城市名稱,並且能夠定位城市(至少是最重要的)。在大型數據庫中執行批量語言翻譯

例如:慕尼黑是一個着名的德國城市。但是,在GeoNames數據庫中,它被註冊爲「München」,即德文的本地名稱。 GeoNames提供了這個名字的英文表達,但是這基本上剝奪了城市名稱的特殊字符(在這種情況下,慕尼黑成爲慕尼黑,而不是慕尼黑)。

有沒有一種方法或服務可以用來將這些城市名稱翻譯成葡萄牙語(或至少英文)並將它們緩存到我的數據庫中?我研究過Google翻譯API,但在其TOS中,禁止使用自動化流程。

在此先感謝。

回答

0

解析維基百科怎麼樣?我經常使用「語言」菜單作爲字典。這需要一些時間,但由於這是一次性操作,所以這並不重要。

+0

雖然我不知道葡萄牙維基的地理情況如何,但你必須看到自己(我只是在短時間內學會了這種語言:))。 – Czechnology 2011-02-25 19:39:40

2

我找到的一個解決方案是解析WordPress翻譯文件,它包含了大洲&城市中的一個語言文件。

  1. 找到你想在這裏的語言:
    http://codex.wordpress.org/WordPress_in_Your_Language
  2. 轉到你想要的語言,並下載WordPress的
  3. 裏面的拉鍊轉到:/可溼性粉劑內容/語言/
    和開放大陸&城市檔案例如。 「大洲 - 城市 - nl_NL.po
  4. 在該文件中,你會擁有所有的翻譯城市的名字,你可以很容易地解析爲您的數據庫

我目前在解析PHP中的城市,當我如果你願意的話,我可以在這裏發佈翻譯過的文件。

+0

不幸的是,葡萄牙語翻譯文件翻譯了很少的城市。之後,我們手動添加別名(通過僱傭某人來確定頂級城市並添加他們的已知名字)。 – DfKimera 2012-08-24 15:51:25