我對Apache SOLR/Lucene完全陌生,但希望將其用於索引PDF文檔。配置索引pdf文檔的SOLR應用程序
我已經開始按照官方教程學習:
[Apache SOLR 4.6.0 Tutorial][1]
我能夠用標題爲「索引數據」,他們索引大二.xml文件來達到本教程中的點。
但是,我不能遵循以下後線在該節之後,所有的東西節。
You have now indexed two documents in Solr, and committed these changes. You can now search for "solr" by loading the "Query" tab in the Admin interface, and entering "solr" in the "q" text box. Clicking the "Execute Query" button should display the following URL containing one result...
它太混亂,信息太少。
任何人都可以請點上SOLR一些基本的教程,教你如何到那裏後配置SOLR和索引.pdf文檔。
從似乎Solr的細胞(ExtractingRequestHandler)是要走的路教程。但那是什麼以及如何使用它,我已經提到的教程中的步驟是我不理解/理解的。
上有堆棧溢出的一些問題,以及與SOLR PDF索引,但它們要麼過於具體或答案是我的理解過於高的水平。我需要使用SOLR進行pdf索引的基本分步教程。
感謝您的閱讀!
謝謝你的詳細解答! :)馬上潛水! :) :) – Nik
評論如果你遇到任何困難:) –