我需要想出如何文件輸出寫入Python中的壓縮文件,類似於下面的兩襯墊在Perl gzip壓縮,它使用Unix gzip將打印到ZIPPED文件句柄的任何內容壓縮到文件「zipped.gz」。Python的等效管道文件輸出到使用管
我知道如何使用「進口的gzip」要做到這一點在Python這樣的:
import gzip
zipped = gzip.open("zipped.gz", 'wb')
zipped.write("Hello world\n")
然而,這是極其緩慢。根據探查器,使用該方法佔用了我運行時間的90%,因爲我正在向各種輸出文件寫入200GB的未壓縮數據。我知道文件系統可能是這個問題的一部分,但我想通過使用Unix/Linux壓縮來解決它。這部分是因爲我聽說使用這個模塊進行解壓縮也很慢。
你需要它在純Python做,或者你可以解決一個呼叫轉換成二進制的文件系統(在Python中,你會使用的子模塊)? – ChristopheD
由於純Python方法太慢,我寧願不要用Python來完成它。 – bu11d0zer
你是否從200GB的未壓縮數據的shell中運行gzip程序?我希望在90-100%的CPU利用率下花費相當多的掛鐘時間 - 在我的Windows機器上,它每GB運行約1分鐘,而Python gzip模塊每GB大約需要2分鐘。 – Dave