我正在嘗試編寫一個腳本,其中包含某些參數的URL,從生成的網頁讀取新網址列表,並在本地下載它們。我對編程非常陌生,從未使用Python 3,所以我有點迷路。使用參數並讀取結果的腳本
下面是示例代碼來進一步說明:
param1 =
param2 =
param3 =
requestURL = "http://examplewebpage.com/live2/?target=param1&query=param2&other=param3"
html_content = urllib2.urlopen(requestURL).read()
#I don't know where to go from here
#Something that can find when a URL appears on the page and append it to a list
#Then download everything from that list
#this can download something from a link:
#file = urllib.URLopener()
#file.retrieve(url, newfilelocation)
從請求URL的輸出是一個很長的頁面,它可以是XML或JSON,有很多的信息不一定需要,所以一些需要搜索形式才能找到需要從以後下載的URL。在頁面上找到的URL直接導致需要的文件(它們以.jpg,.cat等結尾)。
如果您需要任何其他信息,請讓我知道!如果這令人困惑,我很抱歉。
此外,理想情況下,我將下載的文件全部轉到爲它們創建的新文件夾(子目錄)中,並使用文件名作爲當前日期和時間,但我想我可以自己弄清這部分。
您是否正在嘗試解析HTML頁面以查看其他HTML頁面的所有鏈接,並下載其他頁面? –
對不起,應該已經說明了這一點,但鏈接直接指向需要下載的文件。 (它們以.jpg,.cat等結尾)。現在編輯問題。 – moon17