2012-01-06 51 views
0

我實現textrank Java編寫,但它似乎相當緩慢。有誰知道它的預期表現?TextRank運行時間

如果它不預期爲慢,可以任意被下述問題:

1)它似乎並不像有創建一個邊緣,並在添加權重給它的方式JGraphT時間相同,所以我計算重量,如果它> 0,我添加一個邊緣。稍後我將重新計算重量,以便在邊緣循環時添加它們。這是一個可怕的想法?

2)我使用JGraphT。這是一個緩慢的圖書館?

3)什麼我可以做,使之更快?

+1

請量化「相當緩慢」。 – 2012-01-07 01:30:55

回答

1

這取決於你所說的「相當緩慢」的意思。 google搜索的一點發現這個段落:

「我們計算了RAKE和TextRank的總時間(以平均超過100iterations)從INSPEC測試集的500個文摘提取關鍵詞,afterthe摘要從音響LES閱讀和裝載在存儲器中。RAKE提取從500摘要鍵字在160毫秒。TextRank萃取keywordsin RAKE的時間1002毫秒,經6次「。

(見http://www.scribd.com/doc/51398390/11/Evaluating-ef%EF%AC%81ciency上下文。)

所以從這個,我推斷,一個體面的TextRank實現應該能夠〜1秒提取〜500摘要關鍵字。