我正在尋找一種簡單高效的方式來存儲ASCII-7中的UTF-8字符串。憑藉高效的我指的是以下幾點:ASCII編碼的有效方法UTF-8
- 所有輸入ASCII字母數字字符應保持相同的ASCII字母數字字符輸出
- 生成的字符串應該是儘可能短
- 操作必須可逆式沒有任何數據丟失
- 所得ASCII字符串應不區分大小寫
- 應該有對輸入長度
- 沒有限制整個UTF-8範圍應當allowe d
我的第一個想法是使用Punycode(IDNA),因爲它符合前四個要求,但它在最後兩個失敗。
任何人都可以推薦一種替代編碼方案嗎?更好的是,如果有一些代碼可供查看。
你是什麼意思通過「輸入中的所有ASCII字符都應該在輸出中保留ASCII字符」?你在問什麼是7位編碼? – 2010-04-02 15:16:09
我更新了第一點,以便更清楚。我也忘了提及,我希望有大小寫不敏感的輸出,似乎排除UTF-7。 – 2010-04-02 15:38:46
當你說「生成的ASCII字符串應該不區分大小寫」你是什麼意思?字符串只是字符串,它們不區分大小寫或不敏感。你的意思是它應該全部小寫嗎?全部大寫? – 2010-04-02 16:03:32