是否有某種方法可以使用PDFBox爲特定圖像提取「替代文本」?通過PDFBox訪問圖像的「替代文本」
我有一個PDF文件,如http://www.w3.org/WAI/GL/2011/WD-WCAG20-TECHS-20110621/pdf.html#PDF1所述,已將替代文本添加到圖像中。使用PDFBox我可以通過PDFDocument.getDocumentCatalog()。getAllPages()[iterator] .getResources.getImages()找到我通過對象模型到圖像本身(PDXObjectImage)的方式,但是我看不到任何方法從圖像中獲取本身到它的替代文本。
可以在http://dl.dropbox.com/u/12253279/image_test_pass.pdf(它應該說「這是圖像的替代文本」)找到一個小樣本PDF(帶有指定了一些替代文本的單個圖像)。
Matt,你想要做什麼?將PDF轉換爲另一種格式? * PDFBox鏈接不適用於我* –
我的目標是自動檢查每個圖像是否具有與其關聯的一些「替代文本」,作爲輔助功能檢查工具的一部分。 –