PDFLib：提取部分導入頁面

我們有一個文檔在其佈局部分作爲singel pdf文件進行切割：例如標題 - > headline.pdf，段落 - > paragraph01.pdf等爲了達到我們使用座標來了解這些零件的放置位置。（源文件來自OCR工具，保存這些座標）PDFLib：提取部分導入頁面

我們的問題是：切割件是原始文檔的簡單副本，但帶有蒙版內容，文檔邊界排列爲只留下期望的部分可見。所以生成的文檔都是相同的文件大小。我們如何強制PDFLib去掉不需要的部分？我希望有一個解決方案。我們嘗試了很多trimboxes，cropboxes等的組合，但沒有結果。

這裏是我們使用的代碼：

$fWidth = 200;//width of document part 
$fHeight = 20;//height of document part 
$fMinXPoint = 10;//left coordinate x 
$fMinYPoint = 10;//left coordinate y 

$oPdf = new \PDFLib(); 
$oPdf->begin_document('', 'optimize=true linearize=true inmemory=true'); 
$oPdf->set_option('compress=9'); 
$oPdf->set_option('topdown=true'); 
$oLoadedDocument = $oPdf->open_pdi_document($sRealFilePath, '');// original pdf 
$oPage   = $oPdf->open_pdi_page(
        $oLoadedDocument, 
        1, 
        'clippingarea=crop' 
); 
$oPdf->begin_page_ext($fWidth, $fHeight, ''); 
$oPdf->fit_pdi_page($oPage, -$fMinXPoint, -$fMinYPoint, 'position={left top}'); 
$oPdf->end_page_ext("cropbox={0 0 $fWidth $fHeight}"); 
$oPdf->close_pdi_page($oPage); 
$oPdf->close_pdi_document($oLoadedDocument); 
$oPdf->end_document('');

來源

2014-09-23 Jensman

我們如何強制的PDFlib削減不需要的部分了嗎？

這對於PDI是不可能的。對於PDI（PDFlib的PDF導入擴展名），導入的頁面是一個「黑匣子」，整個頁面內容將被複制到輸出PDF中。使用PDFlib + PDI無法操作頁面內容，這對於從頁面中刪除內容是必需的。

來源

2014-09-23 14:00:22 Rainer

謝謝。所以我們必須搜索另一個沒有PDFLib的解決方案。你知道一個圖書館，可以實現這一目標嗎？ – Jensman 2014-09-23 14:46:53

PDFLib：提取部分導入頁面

回答

相關問題