1
A
回答
3
我見過的技巧很簡單,就是簡單地計算所使用的字符數,並將其除以中文每個單詞的平均字符數。通常用於此的數字是1.5
如果您的中文文本有1500個字符,則它大約有1000個字。
我不知道更精確的計算單詞的方法,除了解釋文本本身。這意味着要真正理解所使用單詞的上下文,因爲中文字符有時可以單獨用作單詞,也可以用作複合詞的組成部分。
+0
這似乎是正確的比例:http://www.proz.com/forum/linguistics/58362-word_count_for_chinese.html。 「1.35:1〜1.8:1。通常我們取1.5:1」 – 2011-12-21 00:02:59
相關問題
- 1. PHP:檢查任何基於拉丁語言的字母字符?
- 2. 拉丁語1字符集表不是編碼拉丁語中的字符編碼
- 3. 計算字符串中的字符數
- 4. 拉丁字符
- 5. 更改字符串中的字符 - 不完全是C語言
- 6. TI-84計算器語言中的打印字符串
- 7. 豬拉丁字符串迭代,多字
- 8. 計算plsql中字符串的字數
- 9. 計算字符串中的字數?
- 10. Javascript計算字符串中的數字
- 11. AWK中的拉丁字符
- 12. 在一個字符串中計算一個序列C語言
- 13. Ruby:拉丁語翻譯器中的字符串範圍
- 14. 從字符串中提取不同語言的子字符串
- 15. MySQL將拉丁字符拉平爲非拉丁字符
- 16. 檢查字符串是否只包含拉丁字符?
- 17. 拉丁語言中的highlight.js英語
- 18. 檢查字符串是拉丁字母還是西里爾文
- 19. 非拉丁字符
- 20. DB2 - 計算字符串字符數,不是長度
- 21. 將字符串的Unicode拉丁
- 22. 驗證字符串 - 僅限特定語言字符
- 23. 從字符串不包括非拉丁字符
- 24. 計算字符串中的字符
- 25. 計算字符串中的字符
- 26. 計算字符串中的字符
- 27. 計算不同字符串的數量?
- 28. 計算字符串中不同字符的頻率數
- 29. 不能計算字符串中的字符數
- 30. Specs2斯卡拉錯誤不計算字符串是相同
這取決於該語言的單詞定界符。出於好奇,中文單詞如何結束? – Indranil 2011-12-20 23:47:33
這是一個很好的問題。 – dynamic 2011-12-20 23:48:11
這裏是答案:http://www.anycount.com/WordCountBlog/tag/word-count-in-chinese/ – 2011-12-20 23:54:34