2012-02-01 57 views
1

如何在PDF中編碼從右向左語言(如阿拉伯語)的文本方向?我的理解是,由於PDF基本上是一種圖形格式,所以文本方向的概念不需要真正被編碼。相反,這些字形只需要從右向左在屏幕上進行繪製。然而,PDF參考手冊提到了一個名爲WritingMode的屬性,您可以在其中指定從左到右,從右到左和從上到下,從下到上的組合。PDF文本方向

所以我的問題是:

(1)如果我的理解是正確的,RTL或LTR僅僅由字形畫在屏幕上的方式表示,什麼是WritingMode屬性點? (2)如果在PDF文件中沒有實際的方向性信息編碼,除了字形的繪製順序外,PDF-to-Text程序如果知道給定的行是否應該被右鍵讀取,左到右還是從左到右? (我認爲PDF程序可以檢查從ToUnicode地圖提取的Unicode代碼點是否落入與RTL語言相對應的範圍內。)

回答

0

如果我正確閱讀規範,WritingMode僅適用於Tagged PDF。如果PDF不包含適當的邏輯結構,則不會獲得WritingMode。

根據我的理解,一般的答案是「這取決於」。在R-L書寫中,您可能會在字體中編碼文本高級信息,而單個文本位置會將文本推送到正確的位置。我說「很可能」,因爲實際的生成軟件可能會忽略這一點,並將每個字形置於其自身,而不管字體中的文本前進。然後,你會得到有趣的語言,如阿拉伯語和希伯來語,它們不是嚴格的R-L,因爲數字在R-L線內仍然是L-R。

0

文本方向將在Trm中設置

+0

什麼是「Trm」? – Channel72 2012-02-02 15:02:18

+0

它是用於放置文本的文本矩陣。這是PDF規範中的一個標準術語 – 2012-02-03 16:31:16