0

我想使用谷歌翻譯本地化的XML文件,它有近350K行,但其中一些包含遊戲中的字體大小和顏色的編碼,如下所示:谷歌翻譯錯過了我的文件的編碼

<replacement>&lt;p horizontalalignment="center"&gt;&lt;br/&gt;&lt;image enablescale="false" imagesetpath="00015590.InterD_Jeryoung_3"/&gt;&lt;br/&gt;&lt;image enablescale="true" imagesetpath="00015590.Tag_Dungeon_Six_Superior" scalerate="1.5"/&gt;&lt;image enablescale="true" imagesetpath="00015590.Tag_Dungeon_Four_Superior" scalerate="1.5"/&gt;&lt;br/&gt;&lt;image enablescale="true" imagesetpath="00009499.Field_Boss" scalerate="1.4"/&gt;Хмельной лик&lt;br/&gt;&lt;br/&gt;&lt;/p&gt;Уничтожить зараженных насекомых&lt;br/&gt;возле мест обитания их королевы。&lt;br/&gt;</replacement> 

現在因爲神知道什麼原因,谷歌翻譯會改變在翻譯過程中的代碼爲一些不可接受的編碼,就像這樣:

<replacement> <p horizontalalignment="center"> <br/> <image enablescale="false" imagesetpath="00015590.InterD_Jeryoung_3"/> <br/> <image enablescale = "true "imagesetpath =" 00015590.Tag_Dungeon_Six_Superior "scalerate =" 1.5 "/> <image enablescale="true" imagesetpath="00015590.Tag_Dungeon_Four_Superior" scalerate="1.5"/> <br/> <image enablescale = "true" imagesetpath = "00009499.Field_Boss" scalerate = "1.4" /> Intoxicated face <br/> <br/> </ p> Destroy infected insects <br/> habitats near their queen. <br/> </ replacement> 

有什麼辦法避免這種情況,爲什麼它究竟發生? anyhelp認識上的事,感謝

編輯:我也在尋找一種方式來輸入我的文字,並有它僅與編碼事故改變了完全相同的語言,所以我能夠隔離那些,建立一個比較表,然後用它來修復實際翻譯完成後的錯誤,但我沒有看到在谷​​歌翻譯中選擇與輸入和輸出相同的語言的方式,它總是迫使我選擇不同的輸入或輸入輸出,是有道理的,但如果有辦法做到這一點,我可能能夠解決它..

回答

0

不要喂谷歌翻譯與您的Xml文件,據我所知它不明白XML。

從Xml文件中提取文本。

饋送要翻譯的文本。

將文本轉換回Xml。

您可以簡單地將Xml轉換爲每個Xml元素帶有一行的文本文檔,以便將其更改爲Xml更容易。

更多細節

按照Toolkit你可以上傳:

HTML (.HTML) 
Microsoft Word (.DOC/.DOCX) 
OpenDocument Text (.ODT) 
Plain Text (.TXT) 
Rich Text (.RTF) 
Wikipedia URLs 

和幾個臨時演員,如JSON。所以沒有Xml。

我看到的最好的方法是將您的Xml文檔轉換爲這些類型之一(我可能會使用JSON)並轉換它是這樣一種方式,它可以輕鬆地通過使用任一位置(1行文本文件是XML文檔中的第一個元素)或通過一個ID(XML層次結構中的ID或元素的位置添加到JSON元素)

我的猜測是,該工具包識別出html標籤XML並逃脫它們。因此,另一種選擇可能是未逃脫&gt;>&lt<

+0

這正是我與我張貼的例子在那裏就行了,當我翻譯了整個事情是文本形式,而不是在xml形式.. 無論什麼形式我喂谷歌翻譯,結果是一樣的,它總是以我張貼的方式更改代碼。 – user3658890

+0

不要傳遞html編碼的文本。簡單的英語。首先提取英文文本 –

+0

首先,我想提取俄文文本(將被翻譯成英文),第二..如何建議我這樣做?!我的意思是我不能在350,000行手動執行它!如果我設法以某種方式解決這個問題,那麼在翻譯完成後,我如何將它重新合併到原始編碼格式的正確位置? 任何想法都讚賞.. – user3658890