2013-07-04 62 views
12

阿帕奇Giraph VS Neo4j的:是遍歷算法跨節點在論文兩個圖形處理系統完全不同?如果我們要使用Giraph和Neo4j對存儲在單機(不是分佈式)中的數據進行社交圖表分析,那會更好,爲什麼呢?Neo4j的VS的Apache Giraph在圖遍歷

回答

22

傳遞Neo4j。 Giraph的圖計算作爲Hadoop作業運行,因爲它們旨在用於大型分佈式圖。管理這些作業的開銷太大,無法在僞分佈式單機羣集上運行的小型圖上高效運行。

不僅如此,而且Neo4j的特長是遍歷。這是因爲Neo4j實際上將相鄰關係存儲在文件系統中的雙向鏈表中。看看這個博客條目:

http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html

它解釋的Neo4j優化他們的圖表,用於快速圖形運算存儲諸如遍歷的方式方法。

+3

我同意這個答案。 Neo4j是用於實時分析數據的中小型數據集(數百萬個節點/關係),而giraph/pregel則是針對大規模分佈式工作,用於互聯網大小遍歷。 – Nicholas