我遇到了一個用python逐個字符地遍歷unicode字符串的問題。在Python中對一個unicode字符串進行迭代
print "w: ",word
for c in word:
print "word: ",c
這是我的輸出
w: 文本
word: ?
word: ?
word: ?
word: ?
word: ?
word: ?
我所需的輸出是:
文
本
當我使用LEN(字)我得到6.顯然,每一個字符是3個的Unicode塊。
所以,我的unicode字符串已成功存儲在變量中,但我無法獲取字符。我試過使用編碼('utf-8'),解碼('utf-8)和編解碼器,但仍然無法獲得任何好的結果。這看起來像一個簡單的問題,但對我來說令人沮喪。
希望有人能指點我正確的方向。
謝謝!
感謝您的評論!但是,我仍然收到錯誤「'ascii'編解碼器無法在位置0編碼字符u'\ u5f02':序號不在範圍(128)」中。難道說我的文件不是以unicode的形式讀取的?我使用這行代碼來讀取文件:fileContent = codecs.open('fileName.txt,'UTF-8')。read() – charpi
@charpi什麼錯誤? –
edited :) Thanks – charpi