2012-05-16 188 views
0

除了使用ADO,還有其他方式使用VB6從PDF文件中提取數據嗎?我已成功設法使用VB6打開PDF文件,而不使用Acrobat Reader,但我項目中的下一步需要讀取PDF文件並從中找到數據。例如什麼頁面顯示「水泥」一詞?如何閱讀PDF文件

+1

Err,ADO和PDFs? – Deanna

+1

PDF解析是[非常棘手](http://stackoverflow.com/questions/1251956/is-there-a-pdf-parser-for-php),顯然(這是PHP的,但會給你一個想法複雜)。同時:VB6?! – halfer

+0

你看了這裏:http://stackoverflow.com/questions/7784235/read-pdf-file-contents-in-vb – thejartender

回答

1

一般而言,您將需要依賴外部庫。純粹的VB解決方案(即以文本形式讀取文件並自行處理)不會在一週內完成。

您可以通過自動化使用Adobe Acrobat。一個例子讓你開始http://www.freevbcode.com/ShowCode.asp?ID=7066。但請注意,Adobe Reader是不夠的,你真的需要完整的Acrobat。還有其他流行的PDF閱讀庫(例如poppler),但是您可能很難在VB6中使用這些庫。

關於一般性評論,您的成功機會取決於您的「提取」的含義。簡而言之, PDF是純粹描述性的格式,不包含元信息。即該文件包含諸如「將A放在(x1,y1);將'foo'放在(x2,y2)」等指令。讀取表格或任何類型的結構化信息都需要大量的啓發式檢測。

最好的行動方案可能是嘗試獲取您想要以更適合的數據格式(明文,XML,無論)提取的數據。