我在尋找處理數據的最佳實踐。所以,這就是我迄今爲止所獲得的:1.000.000個類型爲「A」的節點。每個「A」節點可連接到1-1000個「B」型節點和1-10個「C」型節點。處理大數據集(neo4j,mongo db,hadoop)
我已經編寫了一個RESTful服務(Java,Jersey)來將數據導入到neo4j圖中。在導入節點「A」(只有節點,帶有ID,沒有其他數據)後,我注意到neo4j db已經增長到〜2.4GB。
在neo4j中存儲附加字段(名稱,描述,...)是一個好主意嗎?或者我應該設置一個mongoDB/hadoop來使用鍵/值組合來訪問數據?
在我看來,100萬個節點/幾GB不足以保證進入Hadoop。 –