我想運行源代碼中包含unicode(utf-8)字符的Python源文件。我知道這個事實可以通過在開頭添加註釋# -*- coding: utf-8 -*-
來完成。但是,我希望不使用這種方法。運行源代碼中使用Unicode字符的Python 2.7代碼
我能想到的一種方法是以轉義形式寫入unicode字符串。例如,
編輯:更新源。添加了Unicode註釋。
# Printing naïve and 男孩
def fxn():
print 'naïve'
print '男孩'
fxn()
成爲
# Printing na\xc3\xafve and \xe7\x94\xb7\xe5\xad\xa9
def fxn():
print 'na\xc3\xafve'
print '\xe7\x94\xb7\xe5\xad\xa9'
fxn()
我有一個關於上述方法的兩個問題。
- 如何將使用Python的第一個代碼片段轉換爲與 一樣的第一個代碼片段?也就是說,只有unicode序列應該寫入 轉義形式。
- 考慮到只使用unicode(utf-8)字符,該方法是否萬無一失?有什麼可以出錯的嗎?
UTF-8 = Unicode的! UTF-8是Unicode字符集的編碼 –