2011-05-02 110 views
0

我試圖找到一種方式來下載多個網頁,看起來像這樣: https://domain.index.aspx?place=&time=123下載多種動態網頁與BeautifulSoup

如何下載與三個數字結尾的每一頁? 我試過https://domain.index.aspx?place=&time=+[0-9]'\d{3}但兩者都不起作用。

感謝

+0

這與美麗的事情有什麼關係? BeautifulSoup是一個解析器,而不是一個URL下載工具。 urllib2是你的朋友 - 或? – 2011-05-02 15:13:38

+0

您是否要求如何從頁面中以3位數字結尾的方式刮取所有鏈接? – Acorn 2011-05-02 15:14:34

+0

是所有頁面都以三位數字結尾,我使用urllib2進行下載。 – marie 2011-05-02 15:20:52

回答

1

你必須知道你要下載並執行不同的頁面的期末數,爲爲例:

for numb in ('458', '123', '453'): 
    sock = urllib.urlopen('https://domain.index.aspx?place=&time=' + numb) 

,或者如果你想嘗試用3個數字的所有號碼:

for numb in xrange(0,1000): 
    sock = urllib.urlopen('https://domain.index.aspx?place=&time=' + str(numb).zfill(3)) 
+0

謝謝,我會嘗試現在 – marie 2011-05-02 15:41:33