我有一個有13000個文件的gzip壓縮包。我如何從Python程序中只提取其中最大的文件?找到tarball裏面最大的文件
我已經試過通過tarball閱讀並檢查每個文件的提取長度,但這需要太長的時間。有沒有更好的方法來做到這一點?
原代碼(增加了對這個問題的完整起見,即使是選擇一個答案):
from tarfile import TarFile
archive = TarFile(filename)
members = archive.getmembers()
sizes = []
for member in members:
sizes.append(member.size)
largest = max(sizes)
largest_info = sizes.index(largest)
print(largest_info.name)
您如何期望在不查看tarball中的所有文件的情況下找到最大的文件? –