我試圖解析淘寶網站,並與BeautifulSoup.find獲取貨物(照片,文本和鏈接)的信息,但它沒有找到所有的類。beautifulsoup不顯示所有ellements
url='https://xuanniwen.world.tmall.com/category-1268767539.htm?search=y&catName=%BC%D0%BF%CB#bd&view_op=citations_histogram'
def get_html(url):
r = requests.get(url)
return r.text
html=get_html(url)
soup=BeautifulSoup(html, 'lxml')
z=soup.find("div",{"class":"J_TItems"})
z-爲空。 但是,例如:
z=soup.find("div",{"class":"skin-box-bd"})
len(z)
Out[196]: 3
工作正常
爲什麼這種方法行不通?我應該怎麼做才能獲得有關良好的所有信息?我使用的Python 2.7
嘗試'soup.text.find(「J_TItems」)'你會發現它會說'湯'中根本沒有'J_TItems',我認爲發生的事情是你想解析的內容不是在html中,實際上是由JavaScript動態構建的,您應該查看Python的selenium模塊。 –