2012-05-20 25 views
-2

我正在使用諸如PDFBox之類的工具來解釋PDF文件(包括文本,筆畫,字形和圖像)並可以訪問這些流和字典。我不清楚這些組件如何連接在一起以及如何解釋它們。特別是我想知道如何從流中訪問字體。是否存在有關如何解釋PDF文檔的教程和示例

注:我是如何創建PDF文檔

+0

不知道爲什麼downvote /關閉。我需要PDF上的教程 - 我無法通過搜索堆棧溢出來找到它們。問題似乎在範圍和合理清晰 –

+0

這是關於編寫程序來處理PDF。 –

+0

如果PHP可以接受,[本頁](http://uk3.php.net/manual/en/function.pdf-open-pdi.php)看起來像有一些有用的庫技巧(也請參閱評論)。 – halfer

回答

1

你或許應該從閱讀開始PDF Reference在教程不感興趣。這是一個巨大的文件,但你可能只會閱讀相關的部分。

要理解字體流,你基本上需要閱讀有關TrueTypeType1字體格式(這不是一個容易的閱讀)。 PDF可能包含其他字體類型,但TrueType和Type1可能使用最廣泛。

擺弄字體可能會很複雜,因此您可能會發現使用某種字體庫(如FreeType)更容易從PDF字體流中提取信息。

1

planetpdf.com上有很多很好的文章,許多PDF開發人員用有用的通用文章運行博客。我們已經在我們的博客上運行了整個負載(http://www.jpedal.org/PDFblog/)

相關問題