2012-11-07 39 views
2

我想用solr與DIH索引CSV文件。 我已經使用solr wiki上提到的補丁SOLR-2549修補了我的DIH庫(請參閱http://wiki.apache.org/solr/DataImportHandler#Configuration_in_data-config.xml-1),以便在不使用Transformers和LineEntityProcessor的情況下導入csv文件。csv導入與dataimporthandler索爾

不幸的是,我不能讓我的進口工作,我有以下的錯誤堆棧:

INFO: [csv] webapp=/solr path=/dataimport params={command=full-import&optimize=false&clean=true&commit=true&verbose=true} status=0 QTime=33 {deleteByQuery=*:*} 0 33 
7 nov. 2012 14:16:03 org.apache.solr.common.SolrException log 
GRAVE: Full Import failed:java.lang.RuntimeException: java.lang.RuntimeException: org.apache.solr.handler.dataimport.DataImportHandlerException: java.lang.NullPointerException 
     at org.apache.solr.handler.dataimport.DocBuilder.execute(DocBuilder.java:273) 
     at org.apache.solr.handler.dataimport.DataImporter.doFullImport(DataImporter.java:382) 
     at org.apache.solr.handler.dataimport.DataImporter.runCmd(DataImporter.java:448) 
     at org.apache.solr.handler.dataimport.DataImporter$1.run(DataImporter.java:429) 
Caused by: java.lang.RuntimeException: org.apache.solr.handler.dataimport.DataImportHandlerException: java.lang.NullPointerException 
     at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:413) 
     at org.apache.solr.handler.dataimport.DocBuilder.doFullDump(DocBuilder.java:326) 
     at org.apache.solr.handler.dataimport.DocBuilder.execute(DocBuilder.java:234) 
     ... 3 more 
Caused by: org.apache.solr.handler.dataimport.DataImportHandlerException: java.lang.NullPointerException 
     at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:542) 
     at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:411) 
     ... 5 more 
Caused by: java.lang.NullPointerException 
     at org.apache.solr.handler.dataimport.LineEntityProcessor.initDelimitedOrFixedWidth(LineEntityProcessor.java:142) 
     at org.apache.solr.handler.dataimport.LineEntityProcessor.init(LineEntityProcessor.java:115) 
     at org.apache.solr.handler.dataimport.EntityProcessorWrapper.init(EntityProcessorWrapper.java:74) 
     at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:430) 
     at org.apache.solr.handler.dataimport.DocBuilder.buildDocument(DocBuilder.java:498) 
     ... 6 more 

我認爲這是關係到我的數據配置。 這是我的數據-config.xml文件:

<dataConfig> 
    <dataSource name="dfs" type="FileDataSource"/> 
    <document> 
     <entity name="sourcefile" 
       processor="FileListEntityProcessor" 
       fileName="rocinter.csv" 
       rootEntity="false" 
       baseDir="/user/xxx/work/solr/example/example-DIH/solr/csv/inputfolder" 
     > 

      <entity name="entryline" 
        processor="LineEntityProcessor" 
        url="${sourcefile.fileAbsolutePath}" 
        rootEntity="true" 
        dataSource="fds" 
        separator="," 
      > 
      </entity> 
     </entity> 
    </document> 
</dataConfig> 

任何人可以幫我這個已瞭解問題或使用補丁LineEntityProcessor版本導入CSV文件提供了明確的配置文件?

回答

1

我終於從用戶郵件列表中得到了答案。 其實這是修補程序中的一個錯誤。

該修補程序的更新版本附加到jira問題。

參見:SOLR-2549