我正在使用solr5.3。Solr DataImportHandler沒有索引定義的所有數據
我想上傳維基百科頁面文章dump solr使用「DataImportHandler」,但我只有id和標題文件時,我查詢。
下面是我的數據-config.xml中
<dataConfig>
<dataSource type="FileDataSource" encoding="UTF-8" />
<document>
<entity name="page"
processor="XPathEntityProcessor"
stream="true"
forEach="/mediawiki/page/"
url="/mnt/TEST/enwiki-20150602-pages-articles1.xml"
transformer="RegexTransformer,DateFormatTransformer"
>
<field column="id" xpath="/mediawiki/page/id" />
<field column="title" xpath="/mediawiki/page/title" />
<field column="revision" xpath="/mediawiki/page/revision/id" />
<field column="user" xpath="/mediawiki/page/revision/contributor/username" />
<field column="userId" xpath="/mediawiki/page/revision/contributor/id" />
<field column="text" xpath="/mediawiki/page/revision/text" />
<field column="timestamp" xpath="/mediawiki/page/revision/timestamp" dateTimeFormat="yyyy-MM-dd'T'hh:mm:ss'Z'" />
<field column="$skipDoc" regex="^#REDIRECT .*" replaceWith="true" sourceColName="text"/>
</entity>
</document>
</dataConfig>
而且我在下面給entires添加schema.xml中。
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<field name="title" type="string" indexed="true" stored="false"/>
<field name="revision" type="int" indexed="true" stored="true"/>
<field name="user" type="string" indexed="true" stored="true"/>
<field name="userId" type="int" indexed="true" stored="true"/>
<field name="text" type="text_en" indexed="true" stored="false"/>
<field name="timestamp" type="date" indexed="true" stored="true"/>
<field name="titleText" type="text_en" indexed="true" stored="true"/>
我已經從「例如/例如,DIH/Solr的/ Solr的/ conf目錄/ schema.xml中」複製schema.xml中,並在評論中提到去除除了少數例外的所有字段項。
導入數據後,我只是想獲取所有領域,但我只獲得「Id」和「標題」。
另外我試圖運行使用調試模式的documentImport,以便我可以得到一些關於索引的信息,但是每當我選擇調試模式時,它只導入2個文檔。我不知道爲什麼?由於這個原因,我無法調試索引過程。
請繼續引導我。
編輯現在我確定其他字段沒有被索引,因爲當我指定df = user或text時,我得到下面的消息。
「msg」 中: 「未定義字段用戶」,
我查詢象下面這樣: http://localhost:8983/solr/wiki/select?q=%3A & FL = ID%2Ctitle%2Ctext%2Crevision &重量= JSON & indent = true & debugQuery = true
這兩個文檔是否在調試模式下編入索引? – MatsLindh
是的..這些被完全索引。實際上我使用調試模式來檢查爲什麼不是所有的數據都被索引? – virus
更改架構後是否重新加載了核心或重新啓動的Solr? – MatsLindh