我試圖導入幾個包含日期格式爲「yyyyMMdd」的幾個字段的.csv文件。我很快發現DataImportHandler不容易支持csv文件。在DataImportHandler中,可以使用LineEntityProcessor然後使用RegexTransformer,但這很麻煩。我嘗試的下一個方法是將文件發佈到CSVRequestHandler,但我還沒有找到一種方法來指定用於解析字段的SimpleDateFormat。我一直在尋找解決這個問題的方法,但我認爲我註定要麼是預處理步驟,要麼是使用RegexTransformer。任何幫助將不勝感激。具有非標準日期格式字段的Solr CSV導入
編輯:我應該補充一點,我在Solr 3.5上。
這是一次性事情還是需要自動化? – Ansari
這是這些文件的一次性操作,但我認爲,當我開始使用其他csv文件集時,我將遇到同樣的問題。 – Clarke
我還沒有使用CSVRequestHandler - 我建議一個簡單的預處理步驟。使用Python讀取CSV文件並吐出XML,然後在輸出文件上運行post.jar。海事組織更簡單,更強大。 – Ansari