0
從維基百科胭脂-SU度量的定義如下:ROUGE-SU度量,含義和式
ROUGE-SU:跳過-兩字組加上基於單字組-共現統計信息。
我的問題是下面這個指標的精確公式是什麼,ROUGE-SU指標背後的直覺是什麼?
預先感謝您。
從維基百科胭脂-SU度量的定義如下:ROUGE-SU度量,含義和式
ROUGE-SU:跳過-兩字組加上基於單字組-共現統計信息。
我的問題是下面這個指標的精確公式是什麼,ROUGE-SU指標背後的直覺是什麼?
預先感謝您。
S表示跳過bigram。它意味着匹配2個不連續的單詞(即與其他單詞之間),這允許重新編排和重組句子。由於ROUGE評分應該評估自動摘要,這是一個很好的觀點。
的ù意味着單字組,即1-克,=計數常見詞語
因此SU意味着我們計數都跳過兩字組和單字組。重點是讓soft跳過bigram,因爲我們可能不希望爲句子分配0分,僅僅因爲它不具有共同的單元時沒有跳過bigram。
您是否明白了?
無論如何,請注意,ROUGE評分本身並不完美。你總是應該得到幾個表示不同特徵的值。
希望這有助於
pltrdy
作爲一個方面說明,我developped一個腳本來計算兩個文件之間的ROUGE得分。在這裏找到它:https://github.com/pltrdy/files2rouge