?搜索了很多,無法找到與之相關的任何內容。我想要實現的蟒蛇自動文摘:提取基於什麼是基於自動摘要提取算法
-5
A
回答
2
的算法中沒有一個基於提取摘要單一的算法。有幾種不同的算法可供選擇。你應該選擇一個適合你的具體需求。
有萃取基於彙總兩種方法:
監督學習 - 你用自己的關鍵字給節目大量的實例文檔在一起。該程序瞭解什麼是關鍵字。然後你給它一個新的文檔,這次沒有任何關鍵字,程序根據它在訓練階段學到的內容提取這個文檔的關鍵字。有大量的監督學習技巧。僅舉幾例,有神經網絡,決策樹,隨機森林和支持向量機。
無指導的學習 - 你simly給該程序文件並創建關鍵字列表,而不依賴於任何過去的經驗。基於摘要的流行無監督算法是TextRank。
0
首先,我認爲你應該學習如何找到論文和研究。如果你沒有找到任何東西,這是絕對不可能的。在任何情況下,一些基於提取文本summarziation是:
- 易於基於詞頻
- 貝葉斯方法
- 基於圖形的方法,例如TextRank/LexRank是一個良好的開端實現方法。
- 聚類
- 進行彙總
- 基於神經網絡的系統
- 我已經基於優化算法
我建議谷歌上搜索這些方法,看看你會得到什麼方法看到模糊系統。這些有很多變化,我不能確定哪種方法是最好的。請記住找到適當的預處理工具。
祝你好運。
相關問題
- 1. 自動摘要中基於圖的基於加權的語句提取?
- 2. 關於「自動文本摘要(基於語言)」
- 3. 基於集合的散列(摘要)算法?
- 4. 僅獲取維基百科摘要
- 5. 如何從X509Certificate中提取摘要算法
- 6. 提取基於第1列
- 7. 基於ID提取圖像
- 8. 提取基於MATLAB中
- 9. 基於列提取行
- 10. 提取R摘要使用sed
- 11. 獅身人面像自動摘要未顯示屬性摘要
- 12. randperm基於什麼算法?
- 13. 基於字符提取文本 - Flex
- 14. 用於生成自動摘要的開源庫
- 15. 什麼是基於規則的算法?
- 16. EF及摘要的自動生成
- 17. 驗證摘要自動更新
- 18. 自動創建TextField的摘要
- 19. 什麼是摘要認證?
- 20. 使用Python的基於模板的文本摘要
- 21. 基於文件成員的結果摘要
- 22. 基於公共屬性(導軌)採摘
- 23. 的Git再次基於後摘櫻桃
- 24. 活動監視器api獲取摘要
- 25. 無法從DBPedia獲取希伯來語維基百科摘要
- 26. 我們如何表示基於密度的算法(DBSCAN)中的聚類摘要?
- 27. 是否有自動文本摘要的語料庫?
- 28. 帶有toctree的自動摘要不爲方法創建文檔
- 29. Git包文件名 - 什麼是摘要?
- 30. 獅身人面像自動摘要和動態方法