0
我在Solr的開發環境新,並具有以下data_config文件:如何在solr中存儲和索引文件名?
dataConfig>
<dataSource type="BinFileDataSource" />
<document>
<entity name="files" dataSource="null" rootEntity="false"
processor="FileListEntityProcessor"
baseDir="/home/shah/solr/TestIndex" fileName="\.(txt)|(pdf)|(docx)"
onError="skip"
recursive="true">
<field column="fileAbsolutePath" name="id" />
<field column="fileSize" name="size" />
<field column="fileLastModified" name="lastModified" />
<entity
name="documentImport"
processor="TikaEntityProcessor"
url="${files.fileAbsolutePath}"
format="text">
<field column="file" name="fileName"/>
</entity>
</entity>
</document>
我已經包括上述領域在我的schema.xml爲:
還包括相應地在solrconfig文件中導入處理程序。
我有10個文本文件即1abc.txt,2B.txt ......... 10B.txt,我想存儲在一個字段文件名這些文件的名稱上面decleared:
時我執行導入處理程序,其工作良好,但fileName字段爲空。
在這方面的幫助將不勝感激。
非常感謝我解決了上述問題///它非常簡單,只需將文件名字段放入FileListEntityProcessor中即可。它會索引文件名 –