2014-09-23 24 views
0

我們有一個文檔在其佈局部分作爲singel pdf文件進行切割: 例如標題 - > headline.pdf,段落 - > paragraph01.pdf等 爲了達到我們使用座標來了解這些零件的放置位置。 (源文件來自OCR工具,保存這些座標)PDFLib:提取部分導入頁面

我們的問題是:切割件是原始文檔的簡單副本,但帶有蒙版內容,文檔邊界排列爲只留下期望的部分可見。 所以生成的文檔都是相同的文件大小。 我們如何強制PDFLib去掉不需要的部分?我希望有一個解決方案。我們嘗試了很多trimboxes,cropboxes等的組合,但沒有結果。

這裏是我們使用的代碼:

$fWidth = 200;//width of document part 
$fHeight = 20;//height of document part 
$fMinXPoint = 10;//left coordinate x 
$fMinYPoint = 10;//left coordinate y 

$oPdf = new \PDFLib(); 
$oPdf->begin_document('', 'optimize=true linearize=true inmemory=true'); 
$oPdf->set_option('compress=9'); 
$oPdf->set_option('topdown=true'); 
$oLoadedDocument = $oPdf->open_pdi_document($sRealFilePath, '');// original pdf 
$oPage   = $oPdf->open_pdi_page(
        $oLoadedDocument, 
        1, 
        'clippingarea=crop' 
); 
$oPdf->begin_page_ext($fWidth, $fHeight, ''); 
$oPdf->fit_pdi_page($oPage, -$fMinXPoint, -$fMinYPoint, 'position={left top}'); 
$oPdf->end_page_ext("cropbox={0 0 $fWidth $fHeight}"); 
$oPdf->close_pdi_page($oPage); 
$oPdf->close_pdi_document($oLoadedDocument); 
$oPdf->end_document(''); 

回答

0

我們如何強制的PDFlib削減不需要的部分了嗎?

這對於PDI是不可能的。對於PDI(PDFlib的PDF導入擴展名),導入的頁面 是一個「黑匣子」,整個頁面內容將被複制到輸出PDF中。 使用PDFlib + PDI無法操作頁面內容,這對於從頁面中刪除內容是必需的。

+0

謝謝。所以我們必須搜索另一個沒有PDFLib的解決方案。你知道一個圖書館,可以實現這一目標嗎? – Jensman 2014-09-23 14:46:53