pagerank

    0熱度

    1回答

    我想將JUNG的PageRank算法運行到我現有的neo4j圖形數據庫上,並將節點的分數保存爲屬性以備將來參考。 所以我創建了以下常規文件: import edu.uci.ics.jung.algorithms.scoring.PageRank g = new Neo4jGraph('/path/to/graph.db') j = new GraphJung(g) pr = new Pa

    0熱度

    1回答

    我看到人們吹噓或討論他們的PageRank信息。 如何客觀地批評別人說什麼?例如,如果有人說他們的博客是「Pagerank 3」,那麼究竟是什麼告訴我 我是否有足夠的信息來真正理解該指標的效用?如: 1.什麼搜索引擎 2.什麼搜索查詢將是必要的,以在搜索結果中查看博客 3.其他? 從我的理解「pagerank 3」意味着博客將是特定查詢的搜索結果中的第三個結果。但也許這是對pagerank的一個非

    0熱度

    2回答

    谷歌的PageRank API可以讓你得到一個域名的網頁排名,我認爲它是針對全球所有註冊的域名。假設我想要在意大利語或者西班牙語網站中獲得一次網頁排名。有沒有一種方法可以使用Google功能在特定頂級域名(TLD)中提供網頁排名列表? 我的理解很難,沒有可用的API,因爲擁有所有有效頂級域名的所有域名列表,並做一些緩慢的數學運算來比較全球排名和頂級域名的排名,我不認爲這是一個解決方案。 所以我的問

    1熱度

    1回答

    我有這樣的情況:假設圖G有4個節點和2個邊:邊A到B的權重爲0.9,邊C到D的權重爲0.1。 在加權圖的PR算法中,對來自一個節點的outlinks的所有權重進行歸一化,使得它們的總和爲1.因此,在我的示例中,兩個權重轉換爲1,則B和D的頁面級值相等。 我需要這種算法的修改版本,使得D從C獲得比B少的質量(或投票),因爲邊C到D的權重較小。最後,D的最終值小於B的值。 我不知道以前是否有人這樣做過

    0熱度

    1回答

    我想在一個真正的大圖(有向圖)運行NetworkX的PageRank,我總是收到此錯誤: Traceback (most recent call last): File "summarize.py", line 120, in <module> s = summerizer().summ(q) File "summarize.py", line 108, in sum

    0熱度

    1回答

    假設我們有一個連接了4頁/節點的圖。我們還計算了該圖的網頁排名,現在我們想要上傳一個新頁面/節點以增加它的網頁排名。我想知道如果我們還上傳了更多的頁面/節點作爲網頁的中心,我們想要增加網頁排名,我們是否能實現我們的目標? (第一張圖和垃圾郵件圖未連接)

    1熱度

    2回答

    Pagerank算法(我知道)假定邊沒有權重。因此,標準的計算公式爲: PR(A) = (1 - d)/N + d*\sigma PR(E)/L(E) 其中L(E)是第Ck的外向鏈接的數量,其中E是指向網頁A. 每個頁面正如你可以在這裏看到,權重在公式中沒有考慮進入A的邊緣。 兩個問題: 一)什麼是調整後的配方,如果我們考慮每一個邊緣進入A的重量,假設體重越高越好(networkx包在Pyth

    2熱度

    1回答

    我對PageRank有任何疑問,可能表明我對此不甚瞭解。如果我有一個帶有兩個節點「A」和「B」以及鏈接A→B權重1.0和B→權重2.0的圖,那麼不應該因爲它的入度權重更高而使A的等級更高? 看來,當我從networkx嘗試PageRank時,情況並非如此,但我不知道爲什麼。 >>> from networkx import nx >>> DG = nx.DiGraph() >>> DG.add

    0熱度

    1回答

    我是Gremlin的新手,我試圖用JUNG實現邊緣權重的pagerank算法。這些是我採取的步驟。我安裝了Gremlin的2.0.0.0版本。我已經使用R中的iGraph包創建了一個.graphml文件,我將其加載到gremlin中。 import edu.uci.ics.jung.algorithms.scoring.PageRank g1 = new TinkerGraph() g1.l

    0熱度

    1回答

    爲什麼我們不使用pagerank算法來考慮頁面的重要性,而總是刪除接收器節點?爲什麼我們關心匯聚節點並考慮Z矩陣以便補償概率轉移矩陣M中的所有零列(匯)?如果有一些重要的原因在保留它們,請告訴它是什麼?