2012-05-30 69 views
0

我已經成功創建了一個使用nutch爬行幾頁的Solr索引。使用Luke查詢索引我得到預期結果(默認字段「內容」)。然而,當我嘗試使用的Solr /管理界面我用Q = 得到的一切:預期:Solr管理員什麼也沒有(nutch)

<response> 
<lst name="responseHeader"> 
    <int name="status">0</int> 
    <int name="QTime">0</int> 
    <lst name="params"> 
    <str name="indent">on</str> 
    <str name="start">0</str> 
    <str name="q">*:*</str> 
    <str name="version">2.2</str> 
    <str name="rows">10</str> 
    </lst> 
</lst> 
<result name="response" numFound="11" start="0"> 
    <doc> 
    <float name="boost">1.0</float> 
    <str name="content"> 
     'a lot of text...' 
    </str> 
    <str name="digest">f73dc90d5ab992f62ba3980de2312dfe</str> 
    <str name="id">http://thenet.net/</str> 
    <str name="segment">20120529084510</str> 
    <str name="title">1 < 2 < 3</str> 
    <date name="tstamp">2012-05-29T06:45:12.872Z</date> 
    <str name="url">http://theurl.net</str> 
    </doc> 

,但查詢特定字符串的時候絕對沒有:

<response> 
    <lst name="responseHeader"> 
    <int name="status">0</int> 
    <int name="QTime">0</int> 
    <lst name="params"> 
     <str name="indent">on</str> 
     <str name="start">0</str> 
     <str name="q">java</str> 
     <str name="version">2.2</str> 
     <str name="rows">10</str> 
    </lst> 
    </lst> 
    <result name="response" numFound="0" start="0"/> 
</response> 

在Solr管理它說:

mro:8983 
cwd=/$PATH_TO_SOLR_AND_NUTH_DIRS/solr/example SolrHome=solr/./ 
HTTP caching is OFF 

在schema.xml中,'content'是默認搜索字段。

任何幫助將不勝感激!

回答

0

請檢查schema.xml文件中的內容字段的fieldType。如果它設置爲string那麼這將解釋爲什麼你沒有得到任何特定文本值的查詢結果。您應該使用fieldType爲text_general或類似的東西來獲得更好的搜索結果,因爲fieldType將標記,篩選和阻止索引的值。有關更多信息,請在Solr Wiki上參考Analyzers, Tokenizers, and Token Filters