我寫了這個代碼由蟒蛇阿拉伯語 - 的UnicodeDecodeError在Python 2.7
import codecs
file = codecs.open("C:\Python27\CCA_raw_utf8.txt","r","utf-8")
text= file.read()
####################################
print "\n "," --------------------------------------------"
text=text[1:]
words=text.split()
for w in words:
if w == unicode ("الشيخ","utf-8"):
print w
處理阿拉伯語,但它不工作,並引發錯誤:爲什麼
if w == unicode ("الشيخ","utf-8"):
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc7 in position 0: invalid continuation byte "
我程序給出了這個結果,我們如何解決這個問題?
好奇的是,在我的IDE中,它表示'輸入中不支持的字符'。 – aIKid