您可以使用有偏序的頁面排名,如Haveliwala在此article中所述。
這個想法很簡單,而不是使用一個普通的隨機組件:[1/n,1/n,....,1/n]
,使用一個有偏向的隨機組件,當你隨機行走時,而不是以概率1/n進入每個頁面,概率f(doc)
,其中f(DOC)是較新的頁面較高,Sigma(f(doc)) = 1
[集合中的所有文檔,讓您的隨機成分會[f(doc1),f(doc2),...,f(docn)]
請注意,每個文件必須是f(doc)>0
,否則銜接不保證[Perron-Frobenius定理不適用]。
另一種可能性是計算定期網頁排名,和相乘它與一個不同的功能g:Collection->R
給出一個數值,以各頁面,並且頁面是較新的,得分越高爲此文檔。
編輯:
作爲響應原來的問題的編輯:
另一種可能性是生成用於所述紙幅的曲線圖的情況下,添加額外的信息w:E->[0,1]
,意思是:添加的權重函數對於每個邊緣,dentoing多麼重要是,如果鏈接是在原始編輯後不久創建的,則w(e)將接近1,並且如果它晚得多,分數將更接近於0.
創建矩陣時,計算pagerank on ,把Matrix[v1][v2] <- w((v1,v2))
,而不是一個簡單的二進制值表示邊緣存在於圖表中。
一旦你有這個矩陣,一般計算PageRank。
最好呈現算法,你嘗試它,但你不能從最早的日期改變它到最新的日期。 –
@SaeedAmiri:OP明確提及他使用的算法:pagerank。這個問題很明顯,熟悉這種算法的人都很熟悉。 – amit
@amit,我知道pagerank但它有一些變化,OP沒有提到他爲什麼不能使用它(有一個小的變化)來使用最新的帖子。 –