2013-08-26 63 views
0

我只想得到dd內的東西。 我有這樣的代碼:如何獲得dd內的項目?

import urllib 
from bs4 import BeautifulSoup 

url = 'http://www.brothersoft.com/windows/mp3_audio/' 
pageHtml = urllib.urlopen(url).read() 
soup = BeautifulSoup(pageHtml) 

for a in soup.select('div.coLeft.cate.mBottom a[href]'): 
    print "http://www.brothersoft.com"+ a['href'] 

但輸出給所有的類中。我只需要dd內的項目。如何獲得?

回答

1

只要把dd其間:

for a in soup.select('div.coLeft.cate.mBottom dd a[href]'): 
    #           ^^ 
    print "http://www.brothersoft.com"+ a['href']