因爲，HTML，和美麗的湯

-2

from BeautifulSoup import BeautifulSoup 
import urllib2,unicodedata 
import re 

for x in range(1,105): 

html_page = urllib2.urlopen('http://xxxxxx/BUSCAR/H=1;OR=5;ST=;LIST_ART_PAGENUMBER='+str(x)+';/Dxxxxx.aspx') 
soup = BeautifulSoup(html_page) 
for link in soup.findAll('a', attrs={'href': re.compile("^http://xxxxxx/PRODUCTO/PROD_ID")}): 
    print link.get('href')

提取鏈接。我正確提取鏈接。但我想提取的範圍從1到105

但這不起作用！

error: expected an indented block

來源

2016-07-01 Damian Perez

當您啓動for循環時，您需要縮進。試試這個：

from BeautifulSoup import BeautifulSoup 
import urllib2,unicodedata 
import re 

for x in range(1,105): 

    html_page = urllib2.urlopen('http://xxxxxx/BUSCAR/H=1;OR=5;ST=;LIST_ART_PAGENUMBER='+str(x)+';/Dxxxxx.aspx') 
    soup = BeautifulSoup(html_page) 
    for link in soup.findAll('a', attrs={'href':re.compile("^http://xxxxxx/PRODUCTO/PROD_ID")}): 
     print link.get('href')

來源

2016-07-01 17:12:46

tksss非常!!!! –

嗨@DamianPerez歡迎您。這是非常基本的，沒什麼。保持學習！如果您覺得滿意，您可以接受答案。 –

因爲，HTML，和美麗的湯

回答

相關問題