我有一個UTF-8字符,我想將它轉換爲16位的unicode編碼。怎麼做?將字符轉換爲16位的unicode編碼
字符的Unicode可以通過閱讀它被寫入文件,並使用再版()等來獲得:
import codecs
f = codecs.open("a.txt",mode='rb',encoding='utf-8')
r = f.readlines()
for i in r:
print i,repr(i)
輸出:
پٹ u'\ufeff\u067e\u0679'
現在,我怎麼能得到的16位unicode編碼爲u'\ufeff\u067e\u0679'
?
「Unicode編碼」不是一個正確的術語。你在談論UCS-2,UTF-16或Unicode代碼點嗎? – Deestan
值得注意的是0xfeff位在這裏只是作爲一個字節順序標記,它不是文本的一部分。 – LexyStardust
從這裏看起來不像utf-8。 '\ u'通常表示一個unicode代碼點。從那裏你可以用不同的格式進行編碼,但不清楚你正在嘗試做什麼。請嘗試更詳細地解釋您的問題。 –