0
我有一個以Unicode或UTF-8編碼的文件(我不知道是哪一個)。當我在Python 3.4中讀取文件時,結果字符串被解釋爲ASCII字符串。我如何將它轉換爲一個Unicode字符串,如u"text"
?如何在Unicode中讀取Unicode文件作爲Unicode字符串
我有一個以Unicode或UTF-8編碼的文件(我不知道是哪一個)。當我在Python 3.4中讀取文件時,結果字符串被解釋爲ASCII字符串。我如何將它轉換爲一個Unicode字符串,如u"text"
?如何在Unicode中讀取Unicode文件作爲Unicode字符串
術語「Unicode」是指標準,而不是特定的編碼。 由於計算機中的文件是二進制文件,因此在二進制文件中存在對Unicode數據進行編碼的不同方式。其中之一是「UTF-8」。
您可以諮詢https://docs.python.org/3/howto/unicode.html
從該文件中抽取的(參見 「閱讀與寫作Unicode數據」)
with open('unicode.txt', encoding='utf-8') as f:
for line in f:
print(repr(line))
在Python 3,不像python2,Unicode字符串常量不寫與「你」。