我從表中導入了23億個關係,導入速度不是很快,每小時獲得5M的速度,需要20天的時間才能完成遷移。我聽說過neo4j批量插入和和batch insert utility。該實用程序通過從csv文件導入來做有趣的事情,但最新的代碼是一些如何破碎和不運行。使用Neo4j批量插入
我在neo4j中有大約100M的關係,我必須全部檢查是否應該沒有重複的關係。
我怎樣才能快速的東西在Neo4j的
通過當前的代碼是這樣
begin transaction
for 50K relationships
create or get user node for user A
create or get user node for user B
check there is relationship KNOW between A to B if not create the relationhsip
end transaction
我也閱讀以下內容:
有關當前如何執行導入的更多詳細信息會有幫助。批處理服務本質上是一種在單個HTTP請求中向服務器發送多個命令的方式,可減少HTTP開銷。 –
我正在讀取數據從數據庫和導入嵌入式neo4j。 – mtariq
你有什麼破的細節嗎?我們很想解決它。 –