2017-05-25 28 views
0

PDF文件夾中有多個不同名稱的PDF文件。如何迭代文件夾中的所有pdf文件以使用apache tika進行數據提取

<dataSource type="BinFileDataSource" name="data"/> 
     <dataSource type="URLDataSource" baseUrl="${solr.install.dir}/example/exampledocs/PDF" name="main"/> 

如何迭代所有這些文件並以文檔名作爲關鍵字對每個文檔內容進行索引。

+0

在https://stackoverflow.com/questions/10252822/indexing-all-documents-in-doc-folder-in-to-solr-filelistentityprocessor中找到答案 – KS6

回答

相關問題