Solr查詢返回0結果

我有幾個索引在索爾文件。當我使用q=*:*進行查詢時，我得到所有文檔，但是當我向q發送一些單詞時，我沒有得到任何結果。以下是schema.xml的片段Solr查詢返回0結果

<?xml version="1.0" ?> 


<schema name="default" version="1.5"> 
    <types> 
    <fieldtype name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/> 
    <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" omitNorms="true"/> 
    <fieldtype name="binary" class="solr.BinaryField"/> 


    <fieldType name="int" class="solr.TrieIntField" precisionStep="0" omitNorms="true" sortMissingLast="true" positionIncrementGap="0"/> 
    <fieldType name="float" class="solr.TrieFloatField" precisionStep="0" omitNorms="true" sortMissingLast="true" positionIncrementGap="0"/> 
    <fieldType name="long" class="solr.TrieLongField" precisionStep="0" omitNorms="true" sortMissingLast="true" positionIncrementGap="0"/> 
    <fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" omitNorms="true" sortMissingLast="true" positionIncrementGap="0"/> 
    <!-- <fieldType name="sint" class="solr.SortableIntField" sortMissingLast="true" omitNorms="true"/> 
    <fieldType name="slong" class="solr.SortableLongField" sortMissingLast="true" omitNorms="true"/> 
    <fieldType name="sfloat" class="solr.SortableFloatField" sortMissingLast="true" omitNorms="true"/> 
    <fieldType name="sdouble" class="solr.SortableDoubleField" sortMissingLast="true" omitNorms="true"/> --> 

    <fieldType name="tint" class="solr.TrieIntField" precisionStep="8" omitNorms="true" positionIncrementGap="0"/> 
    <fieldType name="tfloat" class="solr.TrieFloatField" precisionStep="8" omitNorms="true" positionIncrementGap="0"/> 
    <fieldType name="tlong" class="solr.TrieLongField" precisionStep="8" omitNorms="true" positionIncrementGap="0"/> 
    <fieldType name="tdouble" class="solr.TrieDoubleField" precisionStep="8" omitNorms="true" positionIncrementGap="0"/> 

    <fieldType name="date" class="solr.TrieDateField" omitNorms="true" precisionStep="0" positionIncrementGap="0"/> 
    <!-- A Trie based date field for faster date range queries and date faceting. --> 
    <fieldType name="tdate" class="solr.TrieDateField" omitNorms="true" precisionStep="6" positionIncrementGap="0"/> 

    <fieldType name="point" class="solr.PointType" dimension="2" subFieldSuffix="_d"/> 
    <fieldType name="location" class="solr.LatLonType" subFieldSuffix="_coordinate"/> 
    <fieldtype name="geohash" class="solr.GeoHashField"/> 

    <fieldType name="text" class="solr.TextField"> 
    <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
    <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
</fieldType> 

    <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100"> 
     <!-- <analyzer type="index"> 
     <tokenizer class="solr.StandardTokenizerFactory"/> 
     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> --> 
     <!-- in this example, we will only use synonyms at query time 
     <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/> 
     --> 
     <!-- <filter class="solr.LowerCaseFilterFactory"/> 
     </analyzer> 
     <analyzer type="query"> 
     <tokenizer class="solr.StandardTokenizerFactory"/> 
     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> 
     <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 

     </analyzer> --> 
     <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
    <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
    </fieldType> 

    <fieldType name="text_en" class="solr.TextField" positionIncrementGap="100"> 
     <!-- <analyzer type="index"> 
     <tokenizer class="solr.StandardTokenizerFactory"/> 
     <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="lang/stopwords_en.txt" 
       /> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.EnglishPossessiveFilterFactory"/> 
     <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> --> 
     <!-- Optionally you may want to use this less aggressive stemmer instead of PorterStemFilterFactory: 
      <filter class="solr.EnglishMinimalStemFilterFactory"/> 
     --> 
     <!-- <filter class="solr.PorterStemFilterFactory"/> --> 
     <!-- </analyzer> 
     <analyzer type="query"> 
     <tokenizer class="solr.StandardTokenizerFactory"/> 
     <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
     <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="lang/stopwords_en.txt" 
       /> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.EnglishPossessiveFilterFactory"/> 
     <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> --> 
     <!-- Optionally you may want to use this less aggressive stemmer instead of PorterStemFilterFactory: 
      <filter class="solr.EnglishMinimalStemFilterFactory"/> 
     --> 

     <!-- <filter class="solr.PorterStemFilterFactory"/> 
     </analyzer> --> 
     <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
    <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
    </fieldType> 

    <fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     </analyzer> 
    </fieldType> 

    <fieldType name="ngram" class="solr.TextField" > 
     <analyzer type="index"> 
     <tokenizer class="solr.KeywordTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.NGramFilterFactory" minGramSize="3" maxGramSize="15" /> 
     </analyzer> 
     <analyzer type="query"> 
     <tokenizer class="solr.KeywordTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     </analyzer> 
    </fieldType> 

    <fieldType name="edge_ngram" class="solr.TextField" positionIncrementGap="1"> 
     <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory" /> 
     <filter class="solr.LowerCaseFilterFactory" /> 
     <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> 
     <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="15" /> 
     </analyzer> 
     <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory" /> 
     <filter class="solr.LowerCaseFilterFactory" /> 
     <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> 
     </analyzer> 
    </fieldType> 
    </types> 

    <fields> 
    <!-- general --> 
    <field name="id" type="string" indexed="true" stored="true" multiValued="false" required="true"/> 
    <field name="django_ct" type="string" indexed="true" stored="true" multiValued="false"/> 
    <field name="django_id" type="string" indexed="true" stored="true" multiValued="false"/> 
    <field name="_version_" type="long" indexed="true" stored ="true"/> 

    <dynamicField name="*_i" type="int" indexed="true" stored="true"/> 
    <dynamicField name="*_s" type="string" indexed="true" stored="true"/> 
    <dynamicField name="*_l" type="long" indexed="true" stored="true"/> 
    <dynamicField name="*_t" type="text_en" indexed="true" stored="true"/> 
    <dynamicField name="*_b" type="boolean" indexed="true" stored="true"/> 
    <dynamicField name="*_f" type="float" indexed="true" stored="true"/> 
    <dynamicField name="*_d" type="double" indexed="true" stored="true"/> 
    <dynamicField name="*_dt" type="date" indexed="true" stored="true"/> 
    <dynamicField name="*_p" type="location" indexed="true" stored="true"/> 
    <dynamicField name="*_coordinate" type="tdouble" indexed="true" stored="false"/> 


    <field name="content" type="text_en" indexed="true" stored="true" multiValued="false" /> 

    <field name="title" type="text_en" indexed="true" stored="true" multiValued="false" /> 

    <field name="text" type="text_en" indexed="true" stored="true" multiValued="false" /> 

    <field name="image" type="text_en" indexed="true" stored="true" multiValued="false" /> 

    <field name="short_desc" type="text_en" indexed="true" stored="true" multiValued="false" /> 

    <field name="pub_date" type="text_en" indexed="true" stored="true" multiValued="false" /> 

    </fields> 

    <!-- field to use to determine and enforce document uniqueness. --> 
    <uniqueKey>id</uniqueKey> 

    <!-- field for the QueryParser to use when an explicit fieldname is absent --> 
    <defaultSearchField>text</defaultSearchField> 

    <!-- SolrQueryParser configuration: defaultOperator="AND|OR" --> 
    <solrQueryParser defaultOperator="OR"/> 
</schema>

我可能會做錯什麼？

EDIT

這裏是在索引的solr文檔的樣品。

這裏是我跑的查詢給我0的結果：

正如你可以清楚地看到該文檔中有提到印度。所以這個文件應該已經被返回。查詢生成有問題嗎？

來源

2015-08-08 Animesh Sharma

要麼你將不得不在下面的字段名稱上激發您的查詢

q =：content：india

，或者你必須定義一個默認域要搜索一個空白查詢字符串中solrconfig文件的選擇處理程序如下

<requestHandler name="/select" class="solr.SearchHandler"> 
     <!-- default values for query parameters can be specified, these 
       will be overridden by parameters in the request 
      --> 
     <lst name="defaults"> 
      <int name="rows">10</int> 
      <str name="qf">content short_description</str> 
     </lst> 
    </requestHandler>

來源

2015-08-09 13:52:44

在這些情況下，我會爲我的http請求添加debugQuery = true參數。顯示的信息包括如何Solr 看到 q參數，所以你應該能夠得到什麼問題。在黑暗中拍攝我猜文檔實際上沒有編入索引，或者您使用的是錯誤的查詢解析器（例如，*：*不是對DisMax的有效查詢）

在您更新後，我看到一個奇怪的東西也許我可能是錯的，我在讀從我的手機發送此looong後）：

沒有填充「文本」字段...

你正在尋找有「印度」的文件但是df（查詢中使用的默認字段）是「text」，所以這是正確的行爲，因爲「text」是空的，所以在「text」中與「india」沒有任何匹配。你可以做下列操作之一：

改變默認的字段從文本內容
明確命名您的查詢內容字段（如內容：印度）
聲明與SRC =內容copyField指令和DST =文本

來源

2015-08-08 20:07:20 Andrea

請參閱我的回答 – Andrea

這本來是一件好事，如果你有共享的字段類型定義中使用了什麼標記生成器，所有過濾器使用等等

如果您已經使用了關鍵詞標記器，它是將整個文本字段視爲單個標記的標記器。

嘗試使用StandardTokenizerFactory或WhitespaceTokenizerFactory。

如果使用WhitespaceTokenizerFactory，標記器將文本流分割爲空白並將非空白字符序列作爲標記返回。請注意，任何標點符號都將包含在標記中。

如果你的輸入流是：「印度的共和國日的成功」

輸出是：「」，「成功」，「中」，「共和國」，「日」，「中」，「印度」

再次如果您添加任何過濾器像停用詞過濾器或小寫過濾器，這將再次是好的。

舉個例子

<fieldType name="text" class="solr.TextField"> 
    <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
    <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
    </analyzer> 
</fieldType>

這裏最後的結果將是不同的

如果你的輸入流是：「共和國日在印度的成功」

輸出是：「」，「成功」，「共和國」，「日」，「中」，「印度」

現在你可以通過「印度」以及「印度」查詢......它會得到匹配

因爲雖然索引你索引它爲「印度」，而在quering你有小寫的過濾器，即使搜索文本是「印度」，它會使它「印度」。

在它的上面，如果您添加禁用詞過濾器廠

也不會像指數的話：「中」，「中」，「中」和這些詞搜索是沒有意義的（它我看來，可能不同於其他）。

solr提供了一個web界面，在這個界面中你可以分析你的字段類型，它是誰索引流...你需要改變什麼，以便你得到正確的結果。

我希望這有助於...

有關所有斷詞和過濾器的更多信息，請看看吧..

https://cwiki.apache.org/confluence/display/solr/Tokenizers#Tokenizers-WhiteSpaceTokenizer

https://cwiki.apache.org/confluence/display/solr/Filter+Descriptions

來源

2015-08-09 10:54:11

的編輯我已經用更新的問題整個架構。進行您所建議的更改。仍然得到0結果。 –

您尚未更改字段「text」的fieldType。之後，你需要重新索引相同的...目前我看到文本的類型仍然是「text_en」，而不是文本...改變一樣，讓我知道它是否適用於你... –

Solr查詢返回0結果

回答

相關問題