2017-05-05 55 views

回答

2

假設你已經在CSV文件中的S3桶CSV文件和一行將被插入作爲一個單獨的XML記錄......這不是你的問題清楚,但最常見的情況。如果你的計劃是隻拉中的文件,並堅持他們作爲CSV文件,也有可能被用來訪問S3存儲和拉斷中的文件無證XQuery函數。無論如何,MLCP文件對於理解這個非常靈活和強大的工具非常有幫助。

根據文檔(https://developer.marklogic.com/products/mlcp)支持的數據來源是:

  • 本地文件系統
  • HDFS
  • MarkLogic存檔
  • 另一個MarkLogic數據庫

您可能掛載S3 Bucket將EC2上的本地文件系統繞過需要製作的f MLCP可以訪問。如果這很重要,Google就是你的朋友。我個人還沒有看到過生產穩定的方法,但是我嘗試了很長時間。

無論如何,你需要提供這些文件所支持的來源,最有可能是文件系統位置在這種情況下,如果MLCP可以運行,可以達到的文件。我想這就是你將這些文件放在某處的意思。 MLCP可以在導入模式下處理分隔文件。該文檔對於理解所有選項非常有用。