我有一個python腳本來獲取網頁並對其進行鏡像。它適用於一個特定的頁面,但我不能讓它工作多個。我以爲我可以把多個網址變成一個列表,然後哺養的功能,但我得到這個錯誤:使用urlopen打開網址列表
Traceback (most recent call last):
File "autowget.py", line 46, in <module>
getUrl()
File "autowget.py", line 43, in getUrl
response = urllib.request.urlopen(url)
File "/usr/lib/python3.2/urllib/request.py", line 139, in urlopen
return opener.open(url, data, timeout)
File "/usr/lib/python3.2/urllib/request.py", line 361, in open
req.timeout = timeout
AttributeError: 'tuple' object has no attribute 'timeout'
這裏是有問題的代碼:
url = ['https://www.example.org/', 'https://www.foo.com/', 'http://bar.com']
def getUrl(*url):
response = urllib.request.urlopen(url)
with urllib.request.urlopen(url) as response, open(file_name, 'wb') as out_file:
shutil.copyfileobj(response, out_file)
getUrl()
我已經用盡谷歌試圖找到如何用urlopen()打開一個列表。我找到了一種這樣的作品。它需要一個.txt
文檔並逐行閱讀,將每一行作爲URL提供,但我正在使用Python 3編寫此文檔,並且由於某種原因twillcommandloop
將不會導入。另外,這種方法很笨拙,需要(據說)不必要的工作。
無論如何,任何幫助將不勝感激。
你爲什麼不簡單地用'for'循環迭代你的URL列表? –
回覆sheng的評論時纔想起來!它會將特定部分作爲字符串返回,對嗎? –