1
我正在尋找一個免費的庫(Java/Ruby),它可以在Linux上運行,並且可以從PDF中提取圖像和註釋;類似CGPDFDocument可以在OS X上做。尋找一個linux PDF庫來從PDF中提取註釋和圖像
謝謝!
我正在尋找一個免費的庫(Java/Ruby),它可以在Linux上運行,並且可以從PDF中提取圖像和註釋;類似CGPDFDocument可以在OS X上做。尋找一個linux PDF庫來從PDF中提取註釋和圖像
謝謝!
我不知道的圖像,但使用Ruby pdfreader庫我是能夠成功地從一個大的PDF文件中提取註釋的最後一個版本:
PDF::Reader.open(filename) do |reader|
reader.pages.each do |page|
annots_ref = page.attributes[:Annots]
actual_annots = reader.objects[annots_ref]
if actual_annots && actual_annots.size > 0
actual_annots.each do |annot_ref|
actual_annot = reader.objects[annot_ref]
unless actual_annot[:Contents].nil?
puts "Page #{page.number},"+actual_annot[:Contents].inspect
end
end
end
end
end
我想,類似的東西可能完成提取圖像。