0
我知道Apache Tika是一個文本提取器。它可以從doc,pdf,ppt和許多其他文件格式中提取文本。現在我需要iOS中的這個功能,所以我想知道是否有任何替代Apache Tika for iOS?ios的Apache Tika替代品
如果沒有這樣的ios庫,可以告訴我可以提取指定文件格式的工具。
預先感謝您。
我知道Apache Tika是一個文本提取器。它可以從doc,pdf,ppt和許多其他文件格式中提取文本。現在我需要iOS中的這個功能,所以我想知道是否有任何替代Apache Tika for iOS?ios的Apache Tika替代品
如果沒有這樣的ios庫,可以告訴我可以提取指定文件格式的工具。
預先感謝您。
libopc用於從docx,xlsx,pptx中提取文本。
Antiword舊MS格式。
You can extract strings from a PDF using CoreGraphics also和 也使用PDFiPhone。
如果您還想從HTML文檔中提取文本,請查看NSXMLParser。
謝謝你的回答。這非常有用。我也想知道如何從iwork文件(頁面,主題演講,數字)中提取文本。你能給我一些提示嗎? – jjyao