我對圖數據庫相當陌生,我試圖確定Neo4j是否是用於網絡圖上數據挖掘的正確工具,或者是否有更適合的地方。我正在計劃使用圖形數據庫對一些大圖(數百萬個節點/ 10到100萬個邊)執行分析,但是我會考慮應用算法併爲圖中的每個人計算度量標準。例如:使用Neo4j進行數據挖掘
- 對於每個人他們的擴展網絡中有多少人有一定的屬性。
- 每個來自具有某個屬性的人的步數。
- 從事社區檢測
- 運行網頁排名
從尋找到它了一下,好像Neo4j的是非常適合跑步從某個節點開始查詢,但它也適用於應用計算在網絡中的每個人?我已經遇到了'圖計算引擎'這個詞作爲兩者之間的區別,但是似乎找不到太多內容。
是否有任何其他工具在這個尺度上是有用的(gephi和類似的將無法處理我需要使用的數據量)。
謝謝你,對ge很好對兩者之間的區別做一些清晰的說明。我熟悉Hadoop並且一直在考慮Apache Giraph,它似乎專門用於圖形(https://giraph.apache.org/),但是設置hadoop集羣將是一個相對較大的問題。是否有任何gephi(相對較小的圖...我認爲)和hadoop(巨大的圖)之間的中間產品。 – Ger
不知道giraph,我會看看它:) 從我的經驗來看,運行hadoop工作的最簡單且經濟實惠的方式是在[amazon emr]上使用需求羣集(https:// aws .amazon.com/elasticmapreduce /)。好處是,您可以根據您必須處理的數據量來擴展集羣。運行相對較小的羣集非常便宜,而且您沒有任何配置要做! – aherve