2017-07-25 96 views
0

我想使用BeautifulSoup庫的find()函數來抓取地址數據的網頁(此圖中顯示的高亮顯示的街道地址:1)。大多數在線教程僅提供了可以輕鬆地將數據精確定位到特定類別的示例;然而,對於這個特定的站點,街道地址是一個更大的類中的元素=「dataCol col02 inlineEditWrite」,我不知道如何通過find()函數得到它。使用BeautifulSoup網頁抓取位置數據

在這個例子中find()獲得街道地址的參數是什麼?任何幫助將不勝感激。 圖片:1

回答

1

這應該讓你開始,它會找到與類「dataCol col02 inlineEditWrite」的div元素,然後搜索在其中TD元素和打印第一td元素文本:

divTag = soup.find("div", {"class":"dataCol col02 inlineEditWrite"}) 
for tag in divTag: 
    tdTags = tag.find_all("td") 
    print (tdTags[0].text) 

上面的例子假設你想打印來自所有div元素的第一個td元素,其類別爲「dataCol col02 inlineEditWrite」,否則

divTag = soup.find("div", {"class":"dataCol col02 inlineEditWrite"}) 
tdTags = divTag[0].find_all("td") 
print (tdTags[0].text)