2017-02-24 58 views
0

我的問題是,我必須將多頁PDF轉換爲文本,因此我使用imagemagick軟件將PDF簡單地轉換爲圖像,我很容易從圖像中提取文本。但問題是,如果PDF超過40頁,那麼它只會轉換PDF中的最後一頁,因此要麼將每個頁面轉換爲圖像格式,要麼將所有PDF頁面製作成單一圖像。我應該怎麼做?如何將多頁PDF轉換爲imagemagick中的多圖像通過php

在這裏,我已經做到了單頁PDF這裏的每一個PDF轉換成圖像,並存儲在這裏上傳文件夾,你可以看到:

$image = new Imagick(__DIR__.'/'.$target_file); 
$image->setImageFormat('png'); 
$imageName = __DIR__.'/uploads/'.time().'.png'; 
$image->writeImage($imageName); 

請幫助我。我在等待迴應。

+0

爲什麼這個問題被標記爲'JSON'? – arkascha

+0

答案取決於你使用的OCR解決方案,我會說。更具體的什麼輸入格式提供最佳的識別結果。 – arkascha

+0

我只是想知道如何將PDF的所有頁面轉換爲圖像格式。意味着要麼將PDF的所有頁面轉換爲分離的圖像文件,要麼應該創建整個PDF文件的單個圖像。在這種情況下我該怎麼做。 –

回答

2

我解決了我的問題,如果有人遇到類似的問題可以在這裏看到。

$image = new Imagick(__DIR__.'/'.$target_file); 
    $num_pages = $image->getNumberImages(); 
    for($i = 0; $i < $num_pages; $i++) 
    {   
     $image->setIteratorIndex($i); 
     $image->setImageFormat('png'); 
     $imageName = __DIR__.'/uploads/'.$i.time().'.png'; 
     $var = $image->writeImage($imageName); 
    } 
相關問題