2014-06-24 22 views
1

我想在neo4j中插入獨特的節點和關係。在neo4j中插入數據的更快方法?

我用的是什麼: - 在Amazon EC2上運行

數據大小和類型:

TSV File [Multiple]。每個節點包含超過8百萬行[每行代表節點或關係]。節點超過10個文件[= 2百萬個節點],另有200萬個關係。

我使用UniqueNodeFactory來插入節點。並按順序插入,無法找到任何方式插入保存唯一節點的批次。

問題是插入數據需要花費很多時間。例如,插入30萬個獨特節點需要將近一天的時間。有什麼辦法來加快插入?

回答

4

不要這樣做。

Java-REST-Binding從來沒有爲此做過。

二者必選其一

USING PERIODIC COMMIT 1000 
LOAD CSV WITH HEADERS FROM "http://some.url" as line 
CREATE (u:User {name:line.name}) 

您也可以使用合併(帶約束),創建關係等

請參見我的博客文章中的示例:http://jexp.de/blog/2014/06/using-load-csv-to-import-git-history-into-neo4j/ 還是Neo4j的手冊:http://docs.neo4j.org/chunked/milestone/cypherdoc-importing-csv-files-with-cypher.html

+0

使用PERIODIC COMMIT 10000 LOAD CSV FROM'file:csv- data/user/1.txt'AS line FIELDTERMINATOR'\ t'CREATE(n:user {id:line [0],label:line [1],age:行[2],性別:行[3]}) 這是一個有效的查詢neo4j 2.0.3?我收到語法錯誤。 –

+0

另一件事我會用什麼比? 1.Neo4j嵌入式數據庫 2.Java休息裝訂(RestCypherEngine) –

+0

只有2.1及以上 –

相關問題