我是一個研究項目中提取數據,我已經成功地應用於許多網站findAll('div', attrs={'class':'someClassName'})
但該特定網站,Beautifulsoup無法使用ATTRS數據提取= A類
不會返回當任何值我使用attrs選項。但是當我不使用attrs選項時,我會得到完整的html dom。
下面是簡單的代碼,我開始對它進行測試:
soup = bs(urlopen(url))
for div in soup.findAll('div', attrs={'class':'data'}):
print div
如果通過urllib2檢索,則沒有類爲「data」的元素。 – Ansari 2012-07-30 00:21:27
我已將它用於其他網站,並且可以正常使用urllib2 – 2012-07-30 01:40:15
也許亞馬遜爲完整的瀏覽器提供不同的內容。 – Ansari 2012-07-30 04:54:14