2
我想解析perl中的pdf文件中的文本,而無需將pdf轉換爲任何其他格式。可能嗎 ?是否可以使用Perl讀取pdf文件中的文本?
我想解析perl中的pdf文件中的文本,而無需將pdf轉換爲任何其他格式。可能嗎 ?是否可以使用Perl讀取pdf文件中的文本?
是的,你可以。請參考CAM::PDF包。
您可以使用此模塊將文本拉出。
my $pdf = CAM::PDF->new($filename);
my $pageone_tree = $pdf->getPageContentTree(1);
print CAM::PDF::PageText->render($pageone_tree);
刪除我的,你的是更好的包。 – Powertieke 2010-10-29 12:42:38
看到http://stackoverflow.com/questions/1136990/how-can-i-extract-text-from-a-pdf-file-in-perl – 2010-10-29 06:37:42