0
索引PDF時,我有成功地索引PDF的使用POST命令,如下面的鏈接描述:存儲索引PDF文件中http://makble.com/how-to-extract-text-from-pdf-and-post-into-solr沒有「內容」字段中創建使用Solr
條款可以查詢,並且可以使用被發現一般查詢或文字字段。
但是,我沒有看到「內容」字段的生成,因爲我可以與其他PDF相關的字段。我試圖編輯託管模式文件添加字段:
<field name="content" type="text_general" indexed="false" stored="true" multiValued="true"/>
<copyField source="content" dest="text"/>
我收到以下錯誤,當我學嘗試重新加載核心:
<str name="msg">Error handling 'reload' action</str>
<str name="trace">
org.apache.solr.common.SolrException: Error handling 'reload' action at org.apache.solr.handler.admin.CoreAdminOperation.lambda$static$2(CoreAdminOperation.java:110) at org.apache.solr.handler.admin.CoreAdminOperation.execute(CoreAdminOperation.java:370) at org.apache.solr.handler.admin.CoreAdminHandler$CallInfo.call(CoreAdminHandler.java:388) at org.apache.solr.handler.admin.CoreAdminHandler.handleRequestBody(CoreAdminHandler.java:174)
我solrconfig.xml中有這樣的:
<requestHandler name="/update/extract"
startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="lowernames">true</str>
<str name="fmap.meta">ignored_</str>
<str name="fmap.content">_text_</str>
</lst>
</requestHandler>
我想有「內容」字段可用於執行搜索僅位於索引的PDF文件中的文本。