2015-09-20 85 views
1

我想將大型數據集導入到本地Neo4j實例中。我正在嘗試使用導入工具,但目前爲止沒有成功。使用導入工具將TSV數據導入到Neo4j中

由於我的數據量很大,我無法使用Cypher或「LOAD CSV WITH HEADERS」方法(我的數據也沒有標題)。

我試圖用以下語句導入工具:

neo4jimport --into C:\...\my_database --nodes C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB 

我的文件是一個.CSV文件,但該值是製表符分隔。我的頭文件格式:

authorID author_name 

我的主(虛擬實例)文件的樣子:

1 Banana 
2 Apple 
3 Pear 
4 Potato 
5 Tomato 

我嘗試了虛擬文件用逗號與分號和方法工作得很好,但使用選項卡這兩個屬性獲得合併成一個,所以導入後,我有一個名爲只有一個屬性節點:

authorID author_name 

由於我的文件的大小,我不能只是用逗號代替TABS。我嘗試將分隔符更改爲'\ t'和其他組合,但沒有去。

另外我想知道是否可以添加一個靜態標籤,當它被創建時,即使標籤不是從數據文件中讀取。

我正在考慮使用不同的方法,如果導入工具沒有把它拉入Python和py2neo。

我在普通的便攜式機器上使用Neo4j 2.2.3社區版。

任何幫助將不勝感激。

回答

3

你有一個錯字:它不是delimeterdelimiter,看到neo4jimport --help

更新到2.2.5獲得最高性能的最新版本。

你的標題也許應該是:

authorID:ID author_name

,你也應該提供--id-type integer

您可以在命令行中的所有節點提供一個標籤:--nodes:Author

+0

我恨它當發生這種情況(打字錯誤)時,花了整個下午。感謝您的快速回復 - 像魅力一樣。 – user3745794