Im使用solr-sunburnt與Django。我用nutch爬行和索引我的網站。我將nutch schema.xml複製到solr。Solr-Sunburnt-Nutch。內容字段中缺少結果
我面臨的問題是,當我發送查詢時,結果中沒有內容字段。
無論我從sunburnt或直接solr(從瀏覽器,:8983/solr/select)查詢結果是相同的。
我需要做些什麼才能在我的結果中獲得內容字段
P.S.當談到搜索和solr時,我是一個noob。 :)
Im使用solr-sunburnt與Django。我用nutch爬行和索引我的網站。我將nutch schema.xml複製到solr。Solr-Sunburnt-Nutch。內容字段中缺少結果
我面臨的問題是,當我發送查詢時,結果中沒有內容字段。
無論我從sunburnt或直接solr(從瀏覽器,:8983/solr/select)查詢結果是相同的。
我需要做些什麼才能在我的結果中獲得內容字段
P.S.當談到搜索和solr時,我是一個noob。 :)
感謝提示aitchnyu22。
所以原因content
字段沒有在結果中返回;是它沒有得到索引的第一個地方。
的原因,它不被索引,是因爲schema.xml中文件,即從Nutch的複製到Solr中,有content
字段設置爲false
默認的stored
參數。
將此更改爲true
並重新從頭開始索引後,content
字段應顯示在您的結果中。
保存了我的一天。謝謝 :) –
等等領域應該是
<field name="content" type="text" stored="true" indexed="true"/>
這已被設置爲true,Nutch的,Solr的或兩者兼而有之? 當然,這兩個位置應該是相同的,但是哪個組件實際上使用了這個標誌?
嘗試'q = *:*'查看SOlr的所有內容。並考慮索引你自己的東西,而不是爬你自己的網站 – aitchnyu
從solr /管理'*:*'查詢返回的所有結果,但仍然沒有**內容**領域...... – PhoenixDev
那麼,該命令返回每個領域爲每個文檔(受分頁限制)。你的內容字段**沒有被索引**。請排查原因。 – aitchnyu