2012-10-21 16 views
2

我想獲得一些使用Hadoop和頁面排名的經驗。我完成了使用Hadoop的頁面排序算法的簡單實現。現在,我打算分析改變少數算法參數並研究它如何影響頁面排名的可能影響。現在我正在分析懸掛節點如何影響頁面排名。對於這個網頁排名可以做出什麼樣的變化,任何建議都會大大幫助我獲得更深入的知識。使用hadoop的頁面排名

感謝

回答

2

一對夫婦的變化,因爲我知道:

  • 權重PageRank算法:中均勻地分配較大的等級值更重要(流行)的網頁,而不是將一個網頁的等級值其outlink頁面。
  • Topic-sensitive pagerank

    ,其用於改善搜索查詢結果的排序原來的PageRank算法,一個單一的PageRank向量的計算方式,使用Web的鏈接結構,捕捉 相對重要性」 ofWeb頁,獨立於任何特定的爲了產生更精確的搜索結果,我們提出計算一組PageRank向量,使用一組代表性主題進行偏置,以更精確地捕獲關於特定主題的重要性的概念

  • Z.Gy ¨ongi,H. Garcia-Molina和J. Pedersen,「Combating link spam with trustrank」,
  • 您也可以嘗試HITS(超鏈接環境中的權威來源)。
  • 的進一步深入,你可以嘗試在TupleRank: Ranking Relational Databases using Random Walks on Extended K-partite Graphs的PageRank的思想應用到其他領域,等等。

+0

非常感謝你的希望。這大大有助於 – stackuser

+0

不客氣! – greeness