2014-02-18 86 views
0

我想提取我的iOS應用程序的PDF文檔文本從PDF閱讀的文本,我使用CGPDFScanner .. 我使用這些鏈接參考:無法在IOS

在上述兩個環節中規定的方法的工作進行一些簡單(Programming in objective c)類型的PDF的..但是,當我嘗試提取PDF文本,如那些在「Head First」系列中,我獲得了垃圾值。請建議我一些解決方案,這將適用於所有類型的pdf

+0

@BradLarson爲什麼反對投票? – ViruMax

+0

我沒有對你的問題投票,只是編輯它來刪除鏈接到一個盜版電子書。 –

回答

-1

嘗試使用http://fastpdfkit.com/,這是我用過的最好的pdf閱讀器庫之一。

+0

我見過fastpdfkit,但我不能使用它,因爲它沒有使用CGPDFDictionary,我想通過使用它。我也嘗試過PDFKitten,但這個庫也無法正確掃描pdf文本。建議對此問題提供一些替代方法(代碼片段)。 – ViruMax

+0

嗯,我沒有遇到這個問題。目前我沒有任何選擇,但會讓你知道,如果我找到任何。 –

0

如果您使用的是PDFKitten,那麼它可能是CMap解析問題。我已經解決了這個問題,並發現幾乎每一個pdf文件的搜索都很順利。

+0

如果使用PDFKitten,則PDF有ToUnicodeMapping時會出現很多問題。它解析CMap是完全錯誤的。它在解析時拋棄了大部分映射。如果您可以解決這個問題,您將能夠正確搜索PDF格式,因爲您將使用適當的文本進行有效利用。 – Swaroop