2013-04-12 33 views
0

我在女巫中遇到了一個問題,那就是在neo4j db中插入一些數據的最佳方法。 我有一個很多電影信息的文件,每部電影都有一個不同的ID,如「tt0202025」。 我也有一個演員信息文件,每個人都有一個像「mm2183122」的編號 我有另一個文件女巫描述了演員屬於哪部電影。 mm2183122 | tt0202025,tt0204548在不知道節點ID的情況下導入Neo4j中的大數據

我發現了一些類似csv插入的東西,但由於數據大小,我無法在節點之間創建關係文件。

我必須首先添加電影節點和演員節點,並在它們之間的關係後?怎麼可能知道爲每個節點創建哪個節點ID來創建關係?數據很大。

我也閱讀了批量插入,但我無法完全理解它是如何工作的,所以我可以在java中編寫我的代碼。

希望有人能指導我!

在此先感謝!

回答

2

正如您所指出的,最簡單的解決方案是插入電影節點和actor節點,然後創建關係。

您可以使用「mm2183122」和「tt0202025」作爲節點上的屬性來跟蹤節點:例如,當您創建節點並在您查詢時對其進行索引時,您的節點上將具有「file_id」屬性想創建一個關係。我會使用唯一的索引來確保您不會複製節點,如果您插入多次。對於REST API,您可以在此獲得文檔:http://docs.neo4j.org/chunked/milestone/rest-api-unique-indexes.html

Cypher還允許您創建唯一的節點。

0

你可以看看Talend Open Studio的大數據 - 它有一個Neo4j連接器。學習曲線非常陡峭,但值得。

相關問題