2016-07-01 37 views
-2

我試着這樣做:因爲,HTML,和美麗的湯

from BeautifulSoup import BeautifulSoup 
import urllib2,unicodedata 
import re 

for x in range(1,105): 

html_page = urllib2.urlopen('http://xxxxxx/BUSCAR/H=1;OR=5;ST=;LIST_ART_PAGENUMBER='+str(x)+';/Dxxxxx.aspx') 
soup = BeautifulSoup(html_page) 
for link in soup.findAll('a', attrs={'href': re.compile("^http://xxxxxx/PRODUCTO/PROD_ID")}): 
    print link.get('href') 

提取鏈接。我正確提取鏈接。但我想提取的範圍從1到105

但這不起作用!

error: expected an indented block 

回答

1

當您啓動for循環時,您需要縮進。試試這個:

from BeautifulSoup import BeautifulSoup 
import urllib2,unicodedata 
import re 

for x in range(1,105): 

    html_page = urllib2.urlopen('http://xxxxxx/BUSCAR/H=1;OR=5;ST=;LIST_ART_PAGENUMBER='+str(x)+';/Dxxxxx.aspx') 
    soup = BeautifulSoup(html_page) 
    for link in soup.findAll('a', attrs={'href':re.compile("^http://xxxxxx/PRODUCTO/PROD_ID")}): 
     print link.get('href') 
+0

tksss非常!!!! –

+0

嗨@DamianPerez歡迎您。這是非常基本的,沒什麼。保持學習!如果您覺得滿意,您可以接受答案。 –