2016-08-17 57 views
0

我有以下CSV文件:Dse的圖形裝載機重複邊緣

一個是與人,另一種是與地址和一個與人的地址連接(每個文件加一個標題行)。在第一次運行測試目的,我有:

配置create_schema:真,load_new:真,load_threads:3

進口與頂點和邊成功。 (兩個頂點和它們之間的一個邊緣)

現在,當我運行相同的腳本(相同的數據,相同的輸入腳本),但具有不同的配置

配置create_schema:假,load_new:假,load_threads:3

看來,節點沒有改變,但我有一個重複的邊緣節點。 (兩個頂點和相同的節點之間的兩條邊)

這是我運行的代碼:

inputfiledir = 'data/' 
personInput = File.csv(inputfiledir + 'sna_person_test.csv').delimiter(',') 
addressInput = File.csv(inputfiledir + 'sna_address_test.csv').delimiter(',') 
personAddressInput = File.csv(inputfiledir + 'san_person_address_test.csv').delimiter(',') 

load(personInput).asVertices { 
    label "person" 
    key "id" 
} 

load(addressInput).asVertices { 
    label "address" 
    key "id" 
} 

load(personAddressInput).asEdges { 
    label "has_address" 
    outV "person_id", { 
     label "person" 
     key "id" 
    } 
    inV "address_id", { 
     label "address" 
     key "id" 
    } 
} 

是否有辦法避免這種情況?

由於

回答

1

這是由於不具有ID,這導致格拉夫裝載機不具有方法來確定是否一個邊緣實際上重複的邊緣。這將導致後續加載複製邊緣,而不是頂點。