2017-01-23 19 views
0

從維基百科胭脂-SU度量的定義如下:ROUGE-SU度量,含義和式

ROUGE-SU:跳過-兩字組加上基於單字組-共現統計信息。

我的問題是下面這個指標的精確公式是什麼,ROUGE-SU指標背後的直覺是什麼?

預先感謝您。

回答

0

S表示跳過bigram。它意味着匹配2個不連續的單詞(即與其他單詞之間),這允許重新編排和重組句子。由於ROUGE評分應該評估自動摘要,這是一個很好的觀點。

ù意味着單字組,即1-克,=計數常見詞語

因此SU意味着我們計數都跳過兩字組單字組。重點是讓soft跳過bigram,因爲我們可能不希望爲句子分配0分,僅僅因爲它不具有共同的單元時沒有跳過bigram。

您是否明白了?

無論如何,請注意,ROUGE評分本身並不完美。你總是應該得到幾個表示不同特徵的值。

希望這有助於
pltrdy
作爲一個方面說明,我developped一個腳本來計算兩個文件之間的ROUGE得分。在這裏找到它:https://github.com/pltrdy/files2rouge