2015-09-10 63 views
1

我嘗試使用MLCP將聚合的XML文件加載到ML8中。MLCP聚合XML

這是我的數據:

<?xml version="1.0" encoding="UTF-8"?> 
<export:batch xmlns:export="http://schemas.dikw.nl/exporter/1.0" xmlns="http://schemas.dikw.nl/export/1.0"> 
    <cdm:BerichtInhoud xmlns:cdm="http://schemas.dikw.nl/data/1.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://schemas.dikw.nl/data.xsd"> 
     <cdm:berichtMetaData> 
     <cdm:Bericht>first message</cdm:Bericht> 
     </cdm:berichtMetaData> 
    </cdm:BerichtInhoud> 
    <cdm:BerichtInhoud xmlns:cdm="http://schemas.dikw.nl/data/1.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://schemas.dikw.nl/data.xsd"> 
     <cdm:berichtMetaData> 
     <cdm:Bericht>second message</cdm:Bericht> 
     </cdm:berichtMetaData> 
    </cdm:BerichtInhoud> 
</export:batch> 

這是鋁塑複合命令我使用:

mlcp.sh import \ 
-host localhost \ 
-port 27041 \ 
-username admin \ 
-password admin \ 
-input_file_path ../sampledata/thijstest \ 
-input_file_type aggregates \ 
-aggregate_record_element BerichtInhoud \ 
-aggregate_uri_id berichtId \ 
-output_uri_prefix /sample/thijstest/ \ 
-mode local 

在命令行的結果是這樣的:

15/09/10 10:23:51 INFO contentpump.ContentPump: Hadoop library version: 2.6.0 
15/09/10 10:23:51 INFO contentpump.LocalJobRunner: Content type: XML 
15/09/10 10:23:51 INFO input.FileInputFormat: Total input paths to process : 1 
15/09/10 10:23:51 INFO contentpump.LocalJobRunner: completed 100% 
15/09/10 10:23:51 INFO contentpump.LocalJobRunner: com.marklogic.contentpump.ContentPumpStats: 
15/09/10 10:23:51 INFO contentpump.LocalJobRunner: ATTEMPTED_INPUT_RECORD_COUNT: 0 
15/09/10 10:23:51 INFO contentpump.LocalJobRunner: SKIPPED_INPUT_RECORD_COUNT: 0 
15/09/10 10:23:51 INFO contentpump.LocalJobRunner: Total execution time: 0 sec 

所以我的結論是,元素'BerichtInhoud'沒有找到,我試圖包括名稱空間,如-aggregate_record_element cmd:Beri chtInhoud。

雖然它是從一月份開始的,但它可能與這個'bug'有關。
Loading data with mlcp - namespace issue

回答

2

只好用這個命名空間:

-aggregate_record_namespace "http://schemas.dikw.nl/cdm/1.2" \ 
+3

您可以接受自己的問題的答案 - 那需要它掀起的「懸而未決」名單。 –