2016-07-19 52 views
0

我已經通過JSON文檔濃縮分解成幾個領域:內容,標題和id如何搜索摺疊JSON文件

ID是簡單的一個獨特的ID,標題是頁面的標題,例如「頁面標題」和內容就是一切,所以在這個上下文中組成一個網頁的元素如此:圖片替代文字,頁面上的文字等等,但沒有HTML只是原始內容。我希望能夠跨越此內容塊執行搜索,所以說它看起來像這樣

「圖像替換文本從頁面中的文本」如果我搜索「從頁面」我期望的結果。但我沒有得到任何。我的內容字段類型設置爲包括以下過濾器

 <tokenizer class="solr.WhitespaceTokenizerFactory"/> 

    <filter class="solr.StopFilterFactory" 
      ignoreCase="true" 
      words="lang/stopwords_en.txt" 
      /> 
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/> 
    <filter class="solr.LowerCaseFilterFactory"/> 
    <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
    <filter class="solr.PorterStemFilterFactory"/> 

然而,當我查詢我的索引,即使單個詞我沒有得到任何結果: http://localhost:8983/solr/collection1_shard2_replica1/select?q= &重量= JSON &縮進=真

作爲Solr的新手而且被拋在深處但我很掙扎!

回答

0

第一個問題是,這是否索引。檢查您在加載這些字段的令牌時在Admin UI's Schema Browser screen中看到的內容。如果您沒有看到標題和內容字段,則需要查看索引。

如果內容在那裏,問題是你如何搜索它。您需要指定默認字段(df參數)作爲默認搜索類型或類似字段列表(fl參數)與eDisMax。您沒有在查詢中明確地執行此操作,因此必須在/ select處理程序的solrconfig.xml中進行設置。檢查你在那裏。

最有可能搜索文字字段。對於這項工作,需要有從內容標題領域的copyField到文本領域,單獨或作爲一個水珠(srcField =「*」)。請注意,由於您搜索文本字段,所應用的分析鏈是針對該字段的,而不是針對您從中複製內容的任何字段。再次,在Admin UI中加載文本字段的標記以查看它包含的內容。

或者,嘗試在上面的查詢中添加df =內容並查看您是否獲得了一些結果。這也意味着,無論默認字段是什麼,它都不會被填充或填充不正確。