2012-08-11 93 views

回答

0

最簡單的方法是從HTML中提取數據並索引提取的數據。您可以使用HTMLStripCharFilterFactory從輸入流中去除HTML。

<analyzer> 
    <charFilter class="solr.HTMLStripCharFilterFactory"/> 
    <tokenizer class="solr.StandardTokenizerFactory"/> 
</analyzer>