我有Solr 4.10.4,我想索引一個xml文件。 Somes xml標籤包含html標籤。帶有html標記的Solr索引xml文件(帶有DataImportHandler)
<?xml version='1.0' encoding='UTF-8' standalone='no' ?>
<root>
<info>
<text>
<p>text 1</p>
<p>text 2</p>
<p>text 3</p>
</text>
</info>
</root>
我用這個:
<charFilter class="solr.HTMLStripCharFilterFactory"/>
,但它不工作,我不知道什麼是錯。
M.
** solr.HTMLStripCharFilterFactory **將去除索引數據中的html標籤而不是存儲值。你還想要轉換存儲的值嗎? –