2012-09-16 36 views
2

我決定開發一個自動文字彙總使用Python/Django的工具。自動文字彙總

有人能推薦關於如何入門的書籍或文章嗎?

是否有任何開源算法或項目中的自動文本彙總,以便我可以獲得這個想法?

另外,你想在Django/Python中爲我推薦新的具有挑戰性的FYP嗎?

+0

這個想法已經完成。你正在尋找的是「Summly」應用程序他們甚至發佈了一些API的東西,希望可以幫助你。 – Surya

+0

然後建議我新的。 –

+0

你必須自己做。可能這不是問問題的正確方法。 – Surya

回答

1

首先爲紙,我建議:

1-最近的文本自動摘要技術:通過M.Gambhir和V.Gupta
2-文本摘要技術的調查,A.Nenkova的調查

對於Python的工具,我建議採取看看這些工具:

  1. 征服者:NLTK
  2. 王子:TextBlob
  3. 僱傭兵:斯坦福CoreNLP
  4. 篡位:spaCy
  5. 海軍上將:gensim
    首先了解不同類型的研究概述的,什麼最適合你。另外,請記住確保您有針對所定語言的適當預處理工具,因爲這對於彙總程序的質量非常重要。