我正在尋找一種很好的方法來從使用SQL或C#的頁面上的文本中提取相關關鍵字。我打算用這些鏈接將這些關鍵字鏈接到網站的其他部分以導航到相關內容。這在一些博客中看起來很常見。使用c#或SQL從文本中提取關鍵字
2
A
回答
2
一個簡單的方法可能是使用C#下載到內存中,過濾掉HTML標籤,Javascript等(即識別真實內容),將其分解爲單獨的單詞,過濾器與高頻出現的單詞列表在任何通用書面文件中,計算文件中出現的每個單詞的頻率,將出現最多的單詞作爲關鍵詞。
您需要隨着時間的推移開發您的過濾詞列表。
根據您的域名,可能會更恰當地採用相反的方式,並建立一個特定於域的關鍵字列表(或關鍵字組,以便識別「安全帶」和「安全帶」等)作爲同一個詞),並找出每個詞或詞組在給定文檔中出現的次數。那些超過某個閾值,或者前5個或者其他什麼的將是與該文檔相關的關鍵字。
0
有來自Joseph Turian一個很好的信息回答這個問題的更一般的版本:How do I extract keywords used in text?
相關問題
- 1. 從文本中提取標籤或相關關鍵字
- 2. Python:使用關鍵短語從字符串中提取文本
- 3. 從文本中提取關鍵句子
- 4. 從文章中提取關鍵字
- 5. 用於從輸入文本中提取關鍵字的Java庫
- 6. 從文本文檔中提取技術關鍵字
- 7. 從短荷蘭文文本中提取關鍵字
- 8. 如何提取文本中使用的關鍵字?
- 9. 使用彈性搜索從文本中提取關鍵字(多字)
- 10. 如何從Haskell中的文本塊中提取關鍵字
- 11. 從文本中提取關鍵短語(1-4個字節)
- 12. Rails - 從文本塊中提取seo關鍵字
- 13. 如何從文本中提取關鍵字(標籤)
- 14. 從文本中提取所需的關鍵字
- 15. 在C#中使用SQL關鍵字MySqlCommand.CommandText
- 16. 如何使用PHP從孟加拉文本中提取關鍵字
- 17. 使用2個關鍵字從json文本中提取正確的ID?
- 18. 從網頁中提取Meta關鍵字?
- 19. 根據關鍵字從文檔中提取相關部分或段落
- 20. 從提取文本或字符串
- 21. 從Excel或Google電子表格列中提取關鍵字
- 22. 從php中的文本中提取西里爾字詞/關鍵字
- 23. 使用TF-IDF提取關鍵字
- 24. 如何使用DBPedia從內容中提取標籤/關鍵字?
- 25. 使用Javascript從Google Cookie中提取關鍵字
- 26. 從列表中提取關鍵字,然後使用`和`
- 27. 如何使用JavaScript從tynt API中提取關鍵字?
- 28. 用Poppler(C++)從PDF中提取文本
- 29. 提取相關文本給出一個句子,關鍵字或主題
- 30. 從基於關鍵字的固定長度的文本中提取字符串
誰決定哪些關鍵字?這是一些預定義的列表嗎? – 2011-02-13 15:37:27