2017-08-24 110 views
0

我有一個solr 6.6.0實例正在運行並已索引一些文檔 - PDF和HTML。以前我有solr 4,搜索突出顯示的結果很好。 不幸的是,這個(默認)行爲似乎在v6中消失了。該設置是原始solr教程中提到的默認設置。 我玩過很多GET參數,但無法創建突出顯示的內容。 我欣賞任何提示或tipp來獲得這個運行。我是否缺少一些配置更改或參數?Solr 6突出顯示不顯示內容或_text_

例如

http://serv1:8983/solr/gettingstarted/select?wt=json&indent=true&q=betreten&hl=true&hl.method=unified 

{ 
    "responseHeader":{ 
    "zkConnected":true, 
    "status":0, 
    "QTime":152, 
    "params":{ 
     "q":"betreten", 
     "hl":"true", 
     "indent":"true", 
     "hl.method":"unified", 
     "wt":"json"}}, 
    "response":{"numFound":1,"start":0,"maxScore":0.822483,"docs":[ 
     { 
     "id":"/var/docs/2017/08/22/2319/page-1.html", 
     "stream_size":[3820], 
     "x_parsed_by":["org.apache.tika.parser.DefaultParser", 
      "org.apache.tika.parser.html.HtmlParser"], 
     "stream_content_type":["text/html"], 
     "dc_title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"], 
     "ocr_system":["tesseract 3.04.01"], 
     "content_encoding":["UTF-8"], 
     "content_type_hint":["text/html; charset=utf-8"], 
     "resourcename":["/var/docs/2017/08/22/2319/page-1.html"], 
     "title":["/var/docs/2017/08/22/2319/page-1.html (22.08.2017 23:19)"], 
     "content_type":["application/xhtml+xml; charset=UTF-8"], 
     "ocr_capabilities":["ocr_page ocr_carea ocr_par ocr_line ocrx_word"], 
     "_version_":1576604407523442688}] 
    }, 
    "highlighting":{ 
    "/var/docs/2017/08/22/2319/page-1.html":{ 
     "_text_":[]}}} 

謝謝!

回答

1

熒光筆一般分析存儲文本在飛行,以突出顯示。

在您的模式中,請檢查是否存儲_text_。如果它是託管架構,則可能不存儲_text_。請檢查管理型模式或schema.xml中

<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/> 

stored=false表明,_text_內容不被以下_text_配置。如果您設置了stored="true",那麼_text_將被存儲並可用於突出顯示。

注: 改變schema.xml中或託管模式文件後,

  • 需要retstart Solr的實例,這樣的變化將是有效
  • 數據需要重新加載
+0

我在找到的所有managed_schema文件中做了這一點,但結果相同。問題當然是在機器前面,但我無法弄清楚如何修復我 – Aviator

+0

@Aviator,你是否在更改託管模式文件後執行solr restart和reindexing?(我已編輯答案,請檢查它) – Shubhangi

+0

Sorry Shubhang,重新啓動後沒有快樂。我更改了example/files/conf/managed-schema,server/solr/configsets/data_driven_schema_configs/conf/managed-schema和server/solr/configsets/basic_configs/conf/managed-schema中的值,重新啓動並重新編制索引。 – Aviator