2012-05-31 33 views
1

Im使用solr-sunburnt與Django。我用nutch爬行和索引我的網站。我將nutch schema.xml複製到solr。Solr-Sunburnt-Nutch。內容字段中缺少結果

我面臨的問題是,當我發送查詢時,結果中沒有內容字段。

無論我從sunburnt或直接solr(從瀏覽器,:8983/solr/select)查詢結果是相同的。

我需要做些什麼才能在我的結果中獲得內容字段

P.S.當談到搜索和solr時,我是一個noob。 :)

+0

嘗試'q = *:*'查看SOlr的所有內容。並考慮索引你自己的東西,而不是爬你自己的網站 – aitchnyu

+0

從solr /管理'*:*'查詢返回的所有結果,但仍然沒有**內容**領域...... – PhoenixDev

+0

那麼,該命令返回每個領域爲每個文檔(受分頁限制)。你的內容字段**沒有被索引**。請排查原因。 – aitchnyu

回答

1

感謝提示aitchnyu22。

所以原因content字段沒有在結果中返回;是它沒有得到索引的第一個地方。

的原因,它不被索引,是因爲schema.xml中文件,即從Nutch的複製到Solr中,有content字段設置爲false默認的stored參數。

將此更改爲true並重新從頭開始索引後,content字段應顯示在您的結果中。

+0

保存了我的一天。謝謝 :) –

0

等等領域應該是

<field name="content" type="text" stored="true" indexed="true"/> 

這已被設置爲true,Nutch的,Solr的或兩者兼而有之? 當然,這兩個位置應該是相同的,但是哪個組件實際上使用了這個標誌?