2
A
回答
1
看看PDFMiner。它可以很容易地做你想做的事。此外,請搜索類似的問題,因爲這是一個可能的欺騙:Python module for converting PDF to text
2
我們使用Swish-e爲我們的網站編制索引,其中包括成千上萬的PDF,Word文件甚至WordPerfect文件。它效果很好。它是免費的,開源的,並與PHP集成得很好。
從他們的主頁:
沙沙-e是用於索引網頁或其他 文件 集合了快速,靈活和自由 開源系統。 Swish-e非常適合用於收集百萬份文件或 較小的 。使用GNOME™libxml2 解析器和一組過濾器, Swish-e可以索引純文本,電子郵件,PDF,HTML,XML,Microsoft® Word/PowerPoint/Excel和約 任何可以轉換爲XML 或HTML文本。 Swish-e也經常用於補充數據庫,如用於非常快速的全文搜索的MySQL®DBMS數據庫 。
相關問題
- 1. Typo3 PDF索引索引搜索
- 2. Drupal 7索引pdf文件搜索
- 3. pdf內容的索引和搜索
- 4. 索引/搜索PDF內容使用Solr
- 5. 使用Cloudera索引PDF文檔搜索
- 6. 使用AJAX搜索引擎在Chrome中搜索搜索引擎
- 7. 在python中搜索索引
- 8. 在搜索引擎中自動搜索
- 9. Xamarin.iOS Pdf搜索
- 10. 如何讓搜索引擎不再搜索PDF?
- 11. 使用C#搜索OCR(可搜索)PDF
- 12. 索引聊天記錄並在Django中搜索它
- 13. Cloudant搜索索引
- 14. Sphinx搜索索引
- 15. 搜索Lucene索引
- 16. Sitecore索引搜索
- 17. 搜索Lucene索引
- 18. SQL索引搜索
- 19. SQL索引搜索
- 20. Lucene索引搜索
- 21. elasticbundle搜索索引
- 22. MySQL索引搜索
- 23. JQGrid&搜索引擎索引
- 24. 索爾索引與搜索
- 25. 搜索API彈性搜索索引
- 26. Azure搜索索引 - 搜索確切詞
- 27. 如何搜索PDF?
- 28. pdf可搜索ps
- 29. 文本搜索PDF
- 30. 索引在輸出中搜索extbase htmltags