2015-07-06 51 views

回答

0

有幾個方法,你可以實現你的目標:

  1. 加載和分析XML在node.js的程序,並使用elasticsearch node module來索引解析的XML到Elasticsearch。您可能想要特別注意bulk index API以便快速建立索引。

  2. 使用logstash來設置一個管道,該管道從XML文件讀取並將它們索引到Elasticsearch中。 Logstash是一個基於插件的系統,其插件的輸入,過濾和輸出階段與ETL管道的提取,轉換和加載階段相似。您可能需要查看file input pluginxml filter pluginelasticsearch output plugin

+0

您是否建議將XML數據存儲在ElasticSearch中或將其放入像MongoDB或Postgres之類的獨立數據庫中? –

+0

如果我使用logstash,是否需要將XML託管在數據庫中,還是隻能從本地文件填充ElasticSearch? –

+0

這取決於:您如何計劃在存儲XML數據後(在Elasticsearch或單獨的數據庫中)使用XML數據? –