我正在解碼文本。我試圖找到—
字符的字符代碼,而不是將其誤認爲-
,使用ASCII。我試過不成功。有人知道如何轉換它嗎?從維基什麼是' - '的ASCII字符碼?
13
A
回答
20
報價(Em dash)
當實際的破折號是不可用的,因爲在ASCII字符集 - 雙(「 - 」)或三連字符減號(「---」 ) 用來。在Unicode中,em破折號是U + 2014(十進制8212)。
長破折號字符不是ASCII字符集的一部分。
5
—
被稱爲長劃線。它的字符代碼是\u2014
。它不是ASCII字符,因此您不能使用ASCII字符集對其進行解碼,因爲它不在ASCII字符表中。您可能想要使用UTF8。
+0
JavaScript字符串已啓用Unicode,但在內部使用UCS-2而不是UTF-8。無論哪種方式,都不需要知道編碼來表示它,因爲您可以按照'\ u2014'的形式對照Unicode代碼點進行檢查。 – thomasrutter 2016-05-24 01:04:23
2
這個角色不能在ASCII存在,但只以Unicode,通常由UTF-8編碼。
在UTF-8,字符由2-或3-字節序列(或偶爾更長),其中沒有兩個或三個字節是一個有效的ASCII碼,其中所有的人都的ASCII範圍外編碼0至127
人們懷疑的是,以上只是部分地回答你的問題,但如果是這樣那麼這可能是因爲你的問題是,在不經意間,只有部分要求。有關更多詳細信息,可以使用更多細節擴展您的問題。
相關問題
- 1. 這些是什麼ASCII字符?
- 2. 爲什麼US-ASCII編碼接受非US-ASCII字符?
- 3. ASCII碼=>字符
- 4. ASCII碼字符
- 5. 什麼是分隔字符串的最佳ASCII字符?
- 6. 什麼是字符編碼?
- 7. 爲什麼非ASCII字符不相等?
- 8. 爲什麼爲字符串(ASCII)值
- 9. URL編碼ASCII/UTF16字符
- 10. 爲什麼這段代碼打印的ASCII值,而不是字符
- 11. chardet爲什麼說我的UTF-8編碼字符串(最初是從ISO-8859-1解碼的)是ASCII碼?
- 12. 什麼是空終止ASCII字符串的正則表達式?
- 13. 谷歌的字符編碼是什麼?
- 14. 什麼字符是html編碼的?
- 15. 輸入的字符代碼是什麼?
- 16. 這些數字是什麼(ASCII或?)?
- 17. C#解碼非ASCII字符?
- 18. 在MySQL中,爲什麼非ASCII字符真的是兩個字符?
- 19. 獲取參數的字符爲ASCII碼
- 20. 爲什麼這個ASCII字符輸出爲空字符串(VB.NET)?
- 21. 這是什麼字符編碼?
- 22. URL應該是什麼字符編碼?
- 23. 這是什麼字符編碼?
- 24. 這是什麼字符編碼?
- 25. 什麼是ASCII 17-20?
- 26. 爲什麼request.remote_ip.encoding是ASCII-8BIT?
- 27. ASCII空字符
- 28. 爲什麼non-ascii字符顯示爲怪異的符號?
- 29. 是ASCII字符集endian-safe?
- 30. PHP獲取某個字符的ASCII碼
你是什麼意思'解碼這個字符'?源文本中使用了什麼編碼,以及結果中應該使用哪種編碼? – raina77ow 2012-04-27 20:54:05
@ raina77ow:我嘗試在Ascii表中找到此字符的編號 – 2012-04-27 20:54:54
它不在那裏;因此,它的代碼取決於使用什麼編碼。例如,在Latin-1的文本'mdash'表示用號碼151 – raina77ow 2012-04-27 20:57:57