我正在一個加權的DiGraph其中節點= 61634,邊緣= 28,378運行PageRank。NetworkX的python:pagerank_numpy,pagerank失敗,但pagerank_scipy的作品
pagerank(G)
拋出我ZeroDivsionErrorpagerank_numpy(G)
拋出我ValueError異常:數組大pagerank_scipy(G)
給我的網頁排名雖然
我能理解pagerank_numpy
錯誤會由於內存限制,但爲什麼pagerank失敗?我嘗試添加一個無限小的值到零權重的邊,但同樣的問題依然存在。有些指針會很好。不像pagerank_numpy
或pagerank_scipy
-
鏈接到我的GraphML文件 - https://mega.co.nz/#!xlYzEDAI!Lyh5pD-NJL61JPfkrNyJrEm0NnFc586A0MUD8OMYAO0
NetworkX版本 - 1.8.1 Python的 - 因爲它執行使用stochastic_graph
其計算2.7
謝謝你的迴應。是否使用'pagerank_scipy'夠好,或者聽起來像是垃圾進出垃圾?具體而言,我可以使用負權重來保留圖表,並使用'pagerank_scipy'獲得有意義的結果嗎? – Dexter
'pagerank_scipy'應該很好,如果你運行足夠長的時間。但是,我不確定您希望使用負權重學習什麼。 Pagerank基本上是一個在圖形上重新啓動的隨機遊走,其中邊緣權重用於衡量訪問某些鄰居的概率。由於概率是[0,1],我不確定你會如何解釋負重。它應該運行,但。 – mdml
如果我加入一個小的默認權重,如權重爲負值時所說的那樣,會更有意義嗎?我更擔心結果的解釋。 PageRank本質上是達到目的的一種手段。 – Dexter