2017-01-25 80 views
1

我需要從(直接)url中提取pdf文檔的標題,因此我將收到如下網址:http://somepagehere/something/something.pdf,並且我需要僅提取此pdf文檔的標題,而不需要需要下載整個文件。從PHP中通過URL從PDF文檔中提取標題

我看到Zend框架具有類似於此功能的東西:

$pdf = Zend_Pdf::load($pdfFilePath); 
$title=$pdf->properties['Title']; 

但是,我怎麼做這在普通的PHP,以及如何我只有一個url(不需要這麼做下載整個文件)?謝謝。

回答

0

假設你需要提取的文件本身(而不是PDF文件的名稱)的稱號,你需要一個插件來處理,不幸的是 - - 不能用普通的PHP(很容易)完成。然而,有很多的插件可供選擇,和你的使用可以使一個比另一個更適用:

  • ApacheFOP
  • DOMPDF
  • FPDF
  • html2ps的
  • MPDF
  • 的PDFlib
  • TCPDF
  • wkhtmltopdf
  • Zend_Pdf

至於實際的標題提取,你用這種方法是一團糟;加載完整的PDF(不幸你必須這樣做)後,你需要這樣的東西:

$title=$pdf->properties['Title']; 

希望這有助於!

0

你在尋找basename()嗎?

echo basename($pdfFilePath); 

返回結果:

something.pdf 
+0

不,基本名稱只會從url中提取名稱,這是最後的解決方案,但我想提取實際pdf的title屬性,請參閱以下示例:http:// alex .smola.org/drafts/thebook.pdf,在這裏,basename將只返回「thebook」,但文檔的標題是「AnIntroductiontoMachineLearning - thebook」... –

+0

在這種情況下,答案是否定的 - 您需要下載該文件並使用庫來提取標題。 – markt