我正在嘗試閱讀python中的gunzipped文件(.gz),並且遇到了一些麻煩。從python中的gzip文件中讀取utf-8字符
我用gzip的模塊讀取,但該文件編碼爲UTF-8文本文件,以便最終讀取無效字符和崩潰。
有誰知道如何讀取編碼爲utf-8文件的gzip文件?我知道有一個編解碼器模塊可以幫助,但我無法理解如何使用它。
謝謝!
import string
import gzip
import codecs
f = gzip.open('file.gz','r')
engines = {}
line = f.readline()
while line:
parsed = string.split(line, u'\u0001')
#do some things...
line = f.readline()
for en in engines:
print(en)
你可以發佈你到目前爲止的代碼嗎? – 2009-12-10 20:03:42
你能否將utf-8文件轉換爲ascii然後嘗試解壓縮?嗯.... – whatsisname 2009-12-10 20:06:06