2013-08-29 56 views
3

是否有任何公開的自動總結新聞+總結語料庫。如果是的話,你能提供一些方法來獲得它嗎?從哪裏獲得新聞摘要語料庫?

+0

當你說「公開可用」時,你認爲付費語料庫?這裏的Summbank 1.0:http://www.ldc.upenn.edu/Catalog/catalogEntry.jsp?catalogId=LDC2003T16可用於收費。 – Yasen

+0

@Yasen,有沒有免費的語料庫? –

+0

它有幫助嗎? http://web.science.mq.edu.au/~swan/summarization/projects_full.htm – filannim

回答

1

在這裏,你還可以得到Priberam壓縮綜述語料庫免費,這是在葡萄牙:

http://labs.priberam.com/Resources/PCSC.aspx

本文集包含801個文件分割成80周的主題,各自有10個文件(一個有11)。這些文件是來自葡萄牙主要報紙,廣播和電視臺的新聞報道。每個主題還有兩個人類生成的摘要,最多爲100個單詞。人類概要是壓縮性的:註釋者僅執行句子和詞語刪除操作。