2013-02-06 38 views
2

我打算做一個利基搜索引擎。我使用apache-nutch-1.6作爲搜索器,使用apache-solr-3.6.2作爲搜索器。我必須說,網上關於這些技術的信息非常少。如何修改Solr提供的搜索結果頁面?

我按照這個教程http://wiki.apache.org/nutch/NutchTutorial已成功安裝Apache和solr在我的Ubuntu系統上。我也成功地將種子URL注入到webdb並執行爬網。

使用solr界面http://localhost:8983/solr/admin,我也可以查詢抓取的結果。但這是我收到的結果。 enter image description here

我錯過了這裏的東西,早期的apache-nutch-0.7有一場戰爭,它產生了一個清晰的html輸出。 enter image description here。我如何達到這個目標......或者如果有人能指點我最新的教程或指南,非常感謝。

+0

你到現在爲止嘗試過什麼?你有沒有做谷歌(如果不是)搜索?這裏有一個非常類似的問題:http://stackoverflow.com/questions/2411330/how-to-format-solr-result-documents – Oerd

+0

@Oerd:我確實看到了這個問題,我發佈了我的查詢後,一大堆學習和研究。這篇文章[鏈接](http://stackoverflow.com/questions/2411330/how-to-format-solr-result-documents)絕對建議使用xslt,但我想知道如果這是首選的方式。 –

+0

xslt *是*轉換/樣式xml文檔的標準方式 – Oerd

回答

0

我發現下面的鏈接 http://cmusphinx.sourceforge.net/2012/06/building-a-java-application-with-apache-nutch-and-solr/ 這回答我的查詢。

我同意在閱讀上面鏈接中提供的內容後,對我感到很生氣。 Solr包提供了查詢solr所需的所有對象。實際上,必不可少的瓶子只是solr-solrj-3.4.0.jar,commons-httpclient-3.1.jar和slf4j-api-1.6.4.jar。

任何人都可以使用這些對象來構建一個Java搜索引擎來查詢數據庫並擁有一個奇特的UI。

再次感謝。

2

幾件事情:

  • 如果你是剛剛開始,不使用的Solr 3.6,直行到最新的4.1或更高版本。一大堆事情已經發生了變化,添加了許多新功能。
  • 你似乎在說你會將Solr + UI直接暴露給普通網絡 - 這是一個非常糟糕的主意,因爲Solr完全不安全並且允許基於Web的刪除查詢。你真的想要一箇中間的業務層。
  • 使用Solr 4.1,有一個漂亮的Admin UI,並且還有一個/ browse頁面,顯示如何使用Velocity執行Solr支持的頁面。或者看一下如何通過Project Blacklight獲取如何通過Solr獲取UI的示例。
+0

感謝您的回覆,我應該使用apache-nutch-1.6還是應該從apache-nutch-2.1開始。你也可以建議相關的閱讀材料。等待你的回覆。 –

+0

我對nutch不太瞭解。我知道第2版是完全重新設計的,與1.6相比仍然缺少一些功能。另一方面,如果你剛剛開始,那麼使用最新版本是很有意義的。祝你好運。 –

+0

你可以爲JAVA建議一樣嗎? 我的意思是基於Java的WEb應用程序 –