0
我試圖找到一種方式來下載多個網頁,看起來像這樣: https://domain.index.aspx?place=&time=123下載多種動態網頁與BeautifulSoup
如何下載與三個數字結尾的每一頁? 我試過https://domain.index.aspx?place=&time=+[0-9]
和'\d{3}
但兩者都不起作用。
感謝
我試圖找到一種方式來下載多個網頁,看起來像這樣: https://domain.index.aspx?place=&time=123下載多種動態網頁與BeautifulSoup
如何下載與三個數字結尾的每一頁? 我試過https://domain.index.aspx?place=&time=+[0-9]
和'\d{3}
但兩者都不起作用。
感謝
你必須知道你要下載並執行不同的頁面的期末數,爲爲例:
for numb in ('458', '123', '453'):
sock = urllib.urlopen('https://domain.index.aspx?place=&time=' + numb)
,或者如果你想嘗試用3個數字的所有號碼:
for numb in xrange(0,1000):
sock = urllib.urlopen('https://domain.index.aspx?place=&time=' + str(numb).zfill(3))
謝謝,我會嘗試現在 – marie 2011-05-02 15:41:33
這與美麗的事情有什麼關係? BeautifulSoup是一個解析器,而不是一個URL下載工具。 urllib2是你的朋友 - 或? – 2011-05-02 15:13:38
您是否要求如何從頁面中以3位數字結尾的方式刮取所有鏈接? – Acorn 2011-05-02 15:14:34
是所有頁面都以三位數字結尾,我使用urllib2進行下載。 – marie 2011-05-02 15:20:52