昨天我問了一個類似的問題,但我收錄了一些代碼,這些代碼基本上以我想要的不同切線方式提出了我的問題。所以我會再試一次。從網站打開文件
我正在重寫一個抓取網站以查找幾百個文本文件的python腳本,我對該文件第二行之外的任何文本文件內容沒有興趣。以前我會下載所有文件,然後循環遍歷它們以提取第二行。我現在想在我的腳本發現它時打開每個文件,抓住第二行,並關閉它,而不下載到我的硬盤,然後打開它。
因此,基本上有一種方法可以打開www.example.com/123456.txt中的文件,並將該文件的第二行復制到數組或其他東西,而無需下載並打開它。
不,我是知道的,文件打開到內存中,然後將其丟棄聽起來是正確的 – jimstandard
由於'urlopen'返回像文件一樣的對象,你可以簡單地使用'readline'兩次,這可能會避免下載整個文件(取決於緩衝)。無論如何,可能會節省一些大文件傳輸。 –