2011-07-29 44 views
1

我剛剛配置nutch和solr,以便按照geting開始的教程,成功地在網站上抓取和索引文本。現在我正在嘗試通過修改示例速度模板來創建搜索頁面。從solr和nutch生成的搜索索引中獲取文本片段

現在我的問題。如何告訴solr提供點擊內容的相關文本片段?我只會得到與每個匹配相關的以下字段:

分數,提升,摘要,ID,段,標題,日期,tstamp和url。

內容真的被編入索引,因爲我可以搜索我只知道全文中的單詞,但我仍然沒有得到與該命中相關的全文。

回答

1

別忘了:索引與存儲不一樣。

如果所有字段都已編入索引,但沒有字段存儲,您可以搜索文檔中的單詞。 獲取特定字段的內容,它必須也存儲在schema.xml中

= true如果您全文場存儲 ,所以可能是默認的「字段列表設置」不包括全文-領域。 您可以通過使用fl參數補充一點:

http://<solr-url>:port/select/?......&fl=mytext,* 

...這個例子中,如果您的全文被存儲在該字段名爲mytext的

最後,如果你喜歡只的一個片段帶有搜索詞的文本(不是全文)看solr/lucene的高亮部分

+1

完美。然後我走在了正確的軌道上。只是沒有意識到我需要刪除數據目錄來更改schema.xml後擦除索引。 – Johan