閱讀Wikipedia article on UTF-8,我一直想知道術語超長。這個術語被多次使用,但文章沒有提供其含義的定義或參考。什麼是一個超長的形式/編碼?
我想知道是否有人可以解釋這個術語及其目的。
閱讀Wikipedia article on UTF-8,我一直想知道術語超長。這個術語被多次使用,但文章沒有提供其含義的定義或參考。什麼是一個超長的形式/編碼?
我想知道是否有人可以解釋這個術語及其目的。
這是一個代碼點的編碼,它需要更多的代碼單元。
例如,U + 0020以單字節0x20
以UTF-8表示。如果以正常方式解碼兩個字節0xc0 0xa0
,您仍然會回到U + 0020,但這是無效的表示。
Unicode Corrigendum #1有更多的信息,尤其是圍繞表3.1B。
UTF-8在理論上允許不同表示的字符也有一個較短的字符。例如,您可以通過將MSB設置爲零來編碼兩個字節的ASCII字符。 UTF-8規範明確禁止這樣做。
可怕的雙關語。向下投票。 – Computer
@計算機:o.O我錯過了什麼雙關語? – Joey
你說過了! – Computer