任何人都可以請建議我一種方法,通過該方法可以將chm文件編入索引,例如pdf格式的pdfbox。有沒有辦法在Lucene中索引CHM文件?
回答
如果你有,你需要指數也其他文件格式,你可能會發現在Apache Tika
一個更好的,更全面的解決方案,他們只是增加了一個CHM解析器最近(供參考:Support of CHM Format),這將是在下一個版本。
謝謝你。我會看一下 :) – 2011-06-13 11:57:23
如果你正在談論Microsoft Compiled HTML Help文件,你可以用JChm從它們中提取文本,然後以正常的方式對其進行索引。
thnx。我會看一下。 :) – 2011-06-10 14:04:58
要小心。可能有一個二進制和一個文本(.xml存儲爲.hhk)索引,並且它們可能不包含相同的內容。 – 2011-06-11 20:06:39
我用ChmParser amd使用它的檢索文件,並提出了一些解決方法。它似乎運作良好,並且.hhc問題已解決。 Thnx再次 – 2011-06-13 11:47:53
- 1. Lucene索引段文件沒有找到
- 2. 有沒有辦法在Lucene中使用RegexpQuery搜索術語?
- 3. 有沒有辦法在mongoDB中填充文檔的索引文件?
- 4. 有沒有辦法在彈性搜索索引中設置ttl
- 5. 有沒有辦法在Azure搜索索引中「過期」項目?
- 6. 更快的搜索在Lucene中 - 有沒有辦法將整個索引保存在RAM中?
- 7. 有沒有辦法在Lucene中關閉所有Closeables?
- 8. 有沒有辦法在PhpStorm中搜索文件夾(目錄)?
- 9. 有沒有辦法在Mailkit中遞歸搜索文件夾?
- 10. 有沒有辦法解決索引索引
- 11. 有沒有辦法在Fluent nHibernate中命名唯一索引?
- 12. 有沒有辦法在IBOutletCollection中使索引連續?
- 13. 有沒有辦法通過枚舉在Rust中索引數組?
- 14. 有沒有辦法在KendoUI網格中索引數字
- 15. 有沒有辦法在MySQL中禁止未索引的查詢?
- 16. 有沒有辦法在Slick中創建一個聚類索引?
- 17. lucene文件索引
- 18. 索引後有沒有辦法返回文檔體?
- 19. 有沒有辦法在.doc文件裏搜索?
- 20. 有沒有辦法在Eclipse中搜索包中的文本?
- 21. 在chm文件中打開索引選項卡的方法
- 22. 有沒有辦法從Repeater中的DataTable獲取Item的索引?
- 23. 有沒有辦法檢測tableview中索引部分的選擇?
- 24. 有沒有辦法只索引MySQL中的特定列值?
- 25. 有沒有辦法在使用時獲得索引值.... Array.IndexOf?
- 26. Lucene在沒有索引的情況下搜索文件內的內容。
- 27. 有沒有辦法在ipython qtconsole中搜索文本?
- 28. 有沒有辦法在C#中的LINQ Where方法中捕獲索引值?
- 29. 有沒有辦法在彈性搜索中加入2個索引?
- 30. 有沒有辦法將特定版本的文件添加到git索引?
Apache Tika更常用於Lucene,我只是不知道他們對CHM的支持。所以,請接受死亡的答案。 – ffriend 2011-06-13 14:13:27