我真的在尋找一個工具包或現成的工具,它將解析給定的文檔,然後生成一個更好的簡要總結該文件。我知道Python有ntlk和perl有相當多的模塊,這將有助於自然語言分析等。 甚至可以使用類似工具套件的ntlk編寫工具來完成這項工作,但缺乏時間。如果您知道某些此類工具或有一些指向此類工具的指示,如果您可以在此發佈,請提前致謝,謝謝。是否有一個基於Perl或Python的開源工具來生成文檔的思維導圖摘要
3
A
回答
0
谷歌人可能已經在研究這樣的事情。 ;-)
如果我找到了你的話,你需要一個能夠爲你讀取一本書的工具,然後簡要總結一下它的含義,這樣你就可以自己省時間閱讀它。也許你對這些內容不感興趣,而是想對材料進行分類,例如作爲圖書管理員。
對於結構化非常好的文本,在非常專業化的領域中有許多非常相似的文檔,例如論文的數學證明或實驗結果或醫療報告,這在技術上可能是可行的。當然,有可能有一種工具可以區分小說和電話簿,粗略地分類文獻。顯然,提供頁面或單詞計數,識別書面語言等非常容易,因爲這些參數可以明確定義。
當然,電腦肯定會失敗,試圖掌握實際的故事,任何更多的對話或隨意。因此,要決定誰是好人,誰是壞人,或者手頭的作品是以偵探爲題材的愛情小說還是偵探愛上別人的犯罪驚悚片,機器就沒有機會決定什麼是什麼可行的內存量,CPU能力和知識庫。
也許它會幫助,如果你可以更具體的關於你想要使用這個工具的實際目的。
1
有人(這裏是SO)已經有written it for you(discussion)。另一種選擇是TexLexAn(文本分析器分類器總結器)。
相關問題
- 1. 是否有任何類圖生成工具的Python源代碼?
- 2. 是否有Python的文檔工具?
- 3. linux中的思維導圖工具
- 4. 用於生成自動摘要的開源庫
- 5. 是否有一個用於生成.ico文件的Python庫?
- 6. 是否有任何生成AZW文件的工具或項目?
- 7. 基於類設計生成類 - 開源工具?
- 8. 什麼是一個好的開源框架來生成一個XML文件的ASP.NET基於窗體的編輯?
- 9. 基於數據源生成多個文檔的設計模式
- 10. 是否有一個基於C#的開源RDP實現?
- 11. 是否有一個基於開源NSView的UINavigationController類似組件?
- 12. 有一些JavaScript API可以用來開發思維導圖嗎?
- 13. 單一來源文檔工具
- 14. 是否有編程工具用於Perl到Python的轉換?
- 15. 是否有插件用於思維導圖?
- 16. 是否有一個開源的「MSWord文檔到PDF」轉換庫
- 17. 用於生成.doc或.docx文檔文件的Perl模塊
- 18. API文檔生成工具
- 19. 基於文件系統的思維導圖
- 20. 在Python或Perl中,一個好的開源pastebin是什麼?
- 21. 是否有任何工具可以基於自定義語法生成UML圖?
- 22. Python來生成文檔
- 23. 有沒有一個開源的AS lib可以用於類似思維導圖的應用程序?
- 24. 是否有一個用於Python的GUI生成器的IDE?
- 25. Paypal是否使用特定的工具來生成其REST API文檔
- 26. 是否有解析Visual C++生成資源腳本的工具?
- 27. 是否有一個用於生成具體CLR類的IronRuby庫?
- 28. 是否有任何視覺工作室模板工具可以基於其他源代碼生成源代碼?
- 29. 是否有一個「工具」來將基於WCF XAML的活動轉換爲CodeActivity
- 30. 是否有基於Rack或Sinatra的環境配置工具?
感謝您的回覆。實際上,我現在更感興趣的是分析生物信息學和基因組學領域的文件/論文,所以如果我們可以這樣說的話,這個領域就是「受限制的」:-)。目前我正在尋找一個簡單的實用程序,它將對內容進行簡單的解析並以樹形方式生成文檔的地圖。隨着時間的推移,我可以爲它提供一個短語列表,或者應該被認爲是相關聯的單詞列表,如果沒有出現,我可能不得不把它們放在一起。 – datta 2011-01-19 11:34:06