我需要計算文檔內所有條款的頻率。我怎樣才能做到這一點 ? 我不要求密碼。我只是要求指導。其實我正在做一些文件和查詢之間的相似度計算。我已經爲查詢計算了術語頻率。 但我不知道如何計算文件內每個單詞的tern頻率。任何人都可以引導我?感謝您的關注。需要統計文檔中每個條款的頻率
0
A
回答
1
您可以使用HashMap,其中key是您的術語和值 - 它的頻率。每次你看到你的期限,你都會增加價值。文件完成後,你有你的號碼。
1
是,使用HashMap的保存價值,並要經過文件,你可以使用一個Scanner
0
在Java中你一定要留在HashMap<String, Integer>
。術語將是HashMap鍵和術語頻率值。
相關問題
- 1. 統計每個單詞的頻率
- 2. 如何統計陣列中每個單詞的頻率?
- 3. 字詞的頻率和文檔頻率
- 4. 如何確定每個文檔中術語的術語頻率?
- 5. 查詢來計算術語頻率*逆文檔頻率
- 6. IDF(逆文檔頻率)計算
- 7. 如何獲得R中每個條形圖的條形圖的頻率總計?
- 8. 用於文檔分類的計算IDF(逆文檔頻率)
- 9. 需要添加一個條款
- 10. 檢索一個文檔的重要條款
- 11. 如何計算文本文檔中所有單詞的頻率?
- 12. 更好的SQL統計條款數與條款
- 13. 如何合併文件,顯示每個條目的頻率
- 14. 文檔中詞語的頻率
- 15. 文檔中的字數頻率
- 16. Python熊貓頻率文檔
- 17. 需要將文檔上傳到MOSS文檔庫的系統
- 18. MySQL的字數統計頻率
- 19. 如何計算文檔字段中特殊術語的頻率?
- 20. 計算掃頻正弦波形每個採樣的頻率
- 21. 摘要統計的條件
- 22. 音頻文件的每個幀的音頻頻率,如.mp3 .wav
- 23. 比較文檔中的文檔條款矩陣R中的文檔
- 24. 重要性彈性搜索相關的計算逆文檔頻率的得分
- 25. 是否需要在mongodb中鎖定每個文檔?
- 26. 邏輯條件下的計數頻率
- 27. 在一個語料庫的每個文檔中查找最頻繁的詞條
- 28. 如何計算矢量中每個值的出現頻率?
- 29. C語言頻率統計(非C++)
- 30. SAS PROC頻率 - 每個類別的頻率爲多個變量
你能指定文檔如何表示嗎? – ThomasRS 2011-03-14 15:56:53
您是否在發佈之前嘗試搜索?這被問**很多**。 – 2011-03-14 15:59:50
如果你正在尋找術語頻率,[這是一個python程序](https://github.com/timtrueman/tf-idf/blob/master/tf-idf.py)將會計算出它。你可能想看看這個。 – slhck 2011-03-14 16:00:56