我想從csv(文本)文件中讀取(在Python 2.7中),它是7z壓縮的。我不想對整個(大)文件進行解壓縮,而是對這些行進行流式處理。如何從使用7z壓縮的文本文件讀取?
我試過pylzma.decompressobj()
失敗。我收到一個數據錯誤。請注意,此代碼還沒有通過讀取線線:
input_filename = r"testing.csv.7z"
with open(input_filename, 'rb') as infile:
obj = pylzma.decompressobj()
o = open('decompressed.raw', 'wb')
obj = pylzma.decompressobj()
while True:
tmp = infile.read(1)
if not tmp: break
o.write(obj.decompress(tmp))
o.close()
輸出:
o.write(obj.decompress(tmp))
ValueError: data error during decompression
你爲什麼不發佈您的代碼和一個示例文件,這樣我們就可以複製你的錯誤,可以看到我們可以如何幫助? –
.7z文件是可以包含多個文件的容器(檔案文件),那麼您想要讀取的'tests.7z'內的文件名是什麼? – martineau
@martineau,testing.csv – Yariv