我有一個從95個文檔中取得的關鍵字列表。我想列出它們的重要性,但我只有關鍵字出現的文檔數量和所有文檔中關鍵字的最大頻率。我正在尋找一個可能有幫助的排名公式。目前我正在使用IDF,但我想知道是否有更好的公式。關鍵字排名
Q
關鍵字排名
3
A
回答
1
詞頻已經上市的英語(和其他許多LANGS)最重要的話做的Wikitionary Frequency Lists其中有許多類型的基礎上,most important and top words名單,除了TV and Movies most frequent words等等。
如果你喜歡做的基於詞的排名某種算法,我建議你不要去遠離 TF-IDF
和here你可以找到潛在語義索引算法可能我對你的資產。
希望這是你需要的。
1
TF-IDF絕對是一個很好的基礎和易於實現。
在您的文檔中添加其他偏見,例如您的條款的位置也很常見,在文檔開頭出現的術語或更好的名稱往往比中間或末尾出現的更相關。
但是,您必須記住,選擇算法及其偏差還取決於文檔的性質。例如,長篇文件(如研究論文或書籍)需要位置偏差,但不一定是新聞文章。 「IDF」措施也是如此,它必須在大量語料庫上進行計算,這些文檔的內容類型與您的文檔類似。如果您的文檔是關於半導體的研究論文,則您不希望在「電視和電影」語料庫上計算相關度分數。
我的兩分錢。
相關問題
- 1. 排名搜索關鍵字
- 2. 關鍵字搜索和排名結果
- 3. 排名與SQL Server的LIKE關鍵字
- 4. 按關鍵字排序Hashtable?
- 5. [R排除關鍵字
- 6. 按關鍵字排序
- 7. 字典按關鍵字長度排序
- 8. 關鍵詞排名特定網站
- 9. php搜索引擎關鍵詞排名
- 10. 別名javascript關鍵字
- 11. 檢查名稱==關鍵字
- 12. 重命名'this'關鍵字
- 13. 別名爲關鍵字
- 14. 排序/關鍵
- 15. 關鍵字上的其他網頁排名的影響因素
- 16. 尋找特定關鍵字的谷歌平均google排名
- 17. PHP,熱門搜索關鍵字排名系統
- 18. 關鍵字搜索量和谷歌網頁排名
- 19. 根據關鍵字檢查頁面排名的網站
- 20. 排名在SQL中關鍵字的搜索結果
- 21. 如何在Google中爲關鍵字排名?
- 22. 你如何找出你的網站的排名關鍵字?
- 23. 在Python中跟蹤關鍵字的谷歌排名
- 24. Google Maps API - 按關鍵字(城市名稱)排列/中心
- 25. 根據關鍵字外觀排名搜索結果
- 26. Grails域名 - 保留關鍵字名稱
- 27. 在Robot Framework中查找關鍵字名稱(或關鍵字名稱堆棧)
- 28. 使用關鍵字生成排列
- 29. maven中的排除關鍵字
- 30. 根據關鍵字進行Java排序