向翻譯員提供包含HTML的XLIFF是否很常見?帶HTML內容的XLIFF源代碼
CAT工具是否正確支持HTML標籤?
<trans-unit id="1" xml:space="preserve">
<source>This is <b>bold</b></source>
</trans-unit>
更新:
我工作的一個HTML5 WYSIWYG編輯器與窗口小部件,我們需要有翻譯功能的出口。
向翻譯員提供包含HTML的XLIFF是否很常見?帶HTML內容的XLIFF源代碼
CAT工具是否正確支持HTML標籤?
<trans-unit id="1" xml:space="preserve">
<source>This is <b>bold</b></source>
</trans-unit>
更新:
我工作的一個HTML5 WYSIWYG編輯器與窗口小部件,我們需要有翻譯功能的出口。
看一看XLIFF 1.2 Presentation Guide for HTML。
理想情況下,您需要將HTML元素封裝在XLIFF元素中,如下所示: <g id='d' ctype='bold'>bold</g>
。
大多數CAT工具支持所有的本地XLIFF元素,但將治療逃脫HTML爲純文本,這很可能會導致問題。
如果您有需要翻譯是不常見的將其轉換爲XLIFF因爲大多數翻譯環境支持HTML HTML文件。如果您有其他格式(例如Java .properties或帶有HTML內容的.resx或.json),您應該與翻譯人員覈對他的環境是否處理您的格式。一般來說,文件類型之間的每次轉換都可能會破壞某些本機文件格式中具有特殊含義的字符,如<和> XML和HTML中的.properties文件中的撇號,csv文件中的逗號和雙引號等等。如果可能,避免不必要的轉換。
既然你提到Trados Studio中:對於某些文件類型(如XML,例如),它允許添加嵌入式內容處理器,將採取任何嵌入式的HTML標籤的照顧。詳情請查閱Trados Studio help。這個過程的輸出格式不好,但至少它會得到正確的標籤。
您也可以使用霍加皮框架將格式轉換爲XLIFF和定義pipeline已經做了你需要的所有轉換。霍加皮非常強大,但並不總是直覺。
感謝您的評論。我同意儘可能避免轉換,但只要使用正確的編碼,它們就不應像您所描述的那樣「破壞字符」。迄今爲止我看到的最大問題是編寫我自己的XLIFF序列化程序,尤其是使用CAT工具在翻譯字符串中添加「意外」標記(它們是有效的XLIFF標記,但必須解析它們)。 感謝提及霍加皮,不幸的是我看到.NET不再支持。 –
當你有幾個嵌套格式(比如csv裏面的JavaScript)時,就會出現中斷字符的情況,並且你會被要求解析實體和轉義字符,以便翻譯者只能看到他們必須翻譯的文字字符。 你提到的.NET - 你的字符串裏面的resx文件?那麼Passolo或Catalyst將成爲您選擇的翻譯工具,您無需擔心XLIFF。 出於好奇:CAT工具添加了什麼樣的意外標籤?只要XLIFF有效,您可以忽略它們還是將它們去掉? – Jenszcz
需要翻譯的內容是用戶內容,它是在我正在開發的HTML5所見即所得的Web應用程序(帶有ASP.NET後端)中創建的。例如,想象具有需要翻譯的富文本的文本小部件。我需要實現一個功能,將小部件的豐富文本導出到CAT工具可以轉換的文本中,然後實現導入功能。 在手動XLIFF文件測試期間,我看到Trados在XLIFF中添加了一個'
謝謝,我知道這個鏈接。通常不CAT工具都有設置,這讓他們明白,它不要求有''
我正在考慮像MemQ或Trados這樣的流行工具。我試圖查看是否有一種方法無需對XLIFF標籤進行轉換。如果輸入文件是HTML,這些工具可以做到這一點,所以我認爲他們應該能夠以某種方式處理XLIFF中的嵌入式HTML –
Trados Studio會將轉義的HTML視爲純文本,並且使用級聯篩選器可以使memoQ稍微好一些(XLIFF +正則表達式),但這需要使用正則表達式解析HTML,我們都知道如何結束。 – Thomas