2009-09-28 125 views
1

我需要導出信息並且必須翻譯出口文本。在數據庫中數據是非翻譯形式。我的應用程序要求說用戶必須也能夠將導出的CSV文件導入數據庫,所以我需要將翻譯後的文本反轉爲I18N格式,這是數據庫中的數據格式。我該怎麼做,或者有沒有一種理智的方式來做到這一點?是否可以逆轉I18N翻譯?

+0

@newbie字符串,他們是分開的(=一個接一個),還是它們連接在一起?如果他們分開,問題就容易得多。 – KLE 2009-09-28 13:18:18

回答

2

我同意你的意見。 在一般情況下,它似乎是不知名的!就像是: !!!

  • 採取所有翻譯的字符串作爲圖案,一個接一個(使用一些優先級)
  • 當一個模式匹配,與未翻譯值替換爲模式
  • 循環播放,直到完成!

許多問題都可以envisionned ...


這涉及到自然語言處理的研究領域。 所以它很好...研究!在日常編程中不太容易使用!

但是如果您覺得有興趣,Google應該找一些算法。 我相信他們建立在一個複雜的模型上(與正則表達式相比!)。


我希望你有指導您 ... 隨着越來越多的背景下一點的一些其他信息,它可能是一個更容易的問題...

+0

這只是基本的用戶信息表,但有許多領域20 + ... – newbie 2009-09-28 12:28:21

+0

@newbie的字符串,是他們分開(=逐個),或它們被連接?如果他們分開,問題就容易得多。 – KLE 2009-09-28 13:18:54

+0

我加載了翻譯文件以相反的順序散列映射,所以現在我可以使用翻譯後的字符串作爲鍵來獲得反向翻譯... thnx .. – newbie 2009-09-29 06:37:44

0

你需要保持一個字典翻譯消息表。你可能已經有一種形式。

Master message list 
| Message key | English text  | 
| 1   | Payment rejected | 

Translations 
|Translation  | Message key | 
|Paiement rejeté | 1   | 
|Talu Gwrthodwyd | 1   | 
|Maksu hylätty  | 1   | 

您可以使用連接來搜索您的數據導入翻譯的文本,並將其映射回未翻譯的文本(或只是存儲郵件鍵)。

這可能是值得做這個更強大的由「減少」的翻譯文本 - 帶不必要的空白,取代重音符號等存儲翻譯和搜索之前之前執行此操作。數據庫索引應該快速搜索。