2017-08-15 59 views

回答

0

我之前和之後文本一個隱藏的div添加解決的問題:

<updateRequestProcessorChain name="myregex"> 
    <processor class="solr.RegexReplaceProcessorFactory"> 
     <str name="fieldName">mytextfield</str> 
     <str name="pattern">([1]{1}%{2}[A]{1})(.*)([1]{1}%{2}[E]{1})</str> 
     <str name="replacement"> </str> 
     <bool name="literalReplacement">true</bool> 
    </processor> 
</updateRequestProcessorChain> 

它適用於我。

0

使用HTMLStripCharFilterFactory作爲您的字段定義在索引期間的過濾器。

<div style="display:hidden">1%%A</div> 
    TEXT TEXT TEXT 
<div style="display:hidden">1%%E</div> 

,並加入到solrconfig.xml中:

此CHAR過濾帶HTML從輸入流

<analyzer> 
<charFilter class="solr.HTMLStripCharFilterFactory"/> 
<tokenizer ...> 
[...] 
</analyzer> 
+0

HTMLStripCharFilterFactory僅剝離標籤,而不剝離內容。但我需要刪除所有導航鏈接文本。 – dan

相關問題