我想編寫一個工具,幫助我在Linux中搜索pdf/chm/djvu文件。任何關於如何去做的指針?pdf,chm和djvu文件的桌面搜索實用程序
主要問題是從所有這些文件讀取/導入數據。這可以通過C和shell腳本來完成嗎?
我想編寫一個工具,幫助我在Linux中搜索pdf/chm/djvu文件。任何關於如何去做的指針?pdf,chm和djvu文件的桌面搜索實用程序
主要問題是從所有這些文件讀取/導入數據。這可以通過C和shell腳本來完成嗎?
Tracker船舶與Ubuntu 8.04 - 這是來自小獵犬一個顯著開關,用戶認爲太資源(CPU)密集型和沒有取得足夠好的成績。它索引pdf和chm,並根據this bug report它也索引djvu。
請注意,djvu是一種圖像壓縮格式(經過優化以壓縮'文字圖片',通常是掃描結果)。因此,如果您首先在文檔上使用OCR將其轉換爲文本,您將無法搜索文本(元數據除外),這是由cdleary發送的鏈接指的是或。
對於內容被掃描的文章/書籍的PDF也是如此。