維基百科針對Unicode在Latin 1 Supplement下列出了x80-x9F「C1」範圍。該範圍也保留在ISO-8859-1代碼頁中。什麼8位編碼使用C1範圍的字符? (x80-x9F或128-159)
我正在查看一個字符串文件,它們都在7位ASCII範圍內,除了\x96
的幾個實例外,它看起來像一個破折號,例如街道地址的中間。
我不知道C1範圍內的其他字符是否最終會顯示在數據中,所以我想知道是否有正確的方式來讀取文件。是否有任何使用x80至x9F代替終端控制字符的字符數據的8位編碼?
控制字符是從0x00到0x1F。 – Jiminion
@Jim,我相信這些被稱爲「C0」控制字符。從高位開始還有另一個控制字符範圍(或至少在某些編碼中)。 –