如何使用beautifulsoup4從html數據中刪除h2標籤？

我想刪除應用下面的腳本後，我得到的h2標籤。我一直在使用beautifulsoup從網站獲取數據。如何使用beautifulsoup4從html數據中刪除h2標籤？

url = 'http://diningdelights.in/Normal-mum.aspx' 
br = mechanize.Browser() 
br.open(url) 

def select_form(form): 
    return form.attrs.get('id', None) == 'form1' 
br.select_form(predicate=select_form) 
br.form.set_all_readonly(False) 
br.form["hdnPageSearch"]='3' 
br.submit() 

soup = BeautifulSoup(br.response().read()) 

for g_data in soup.find_all("div", class_="innerContainer"): 
    h2_data=g_data.find_all("h2") 
    print h2_data

我只是在h2中獲取數據。例如。

<h2> Evergreen </h2>, <h2> Evergreen</h2>

有人可以幫助我如何刪除下面的標籤。

來源

2015-02-09 user3290624

您正在打印元素;如果你想要中的這個元素，那麼檢索那個。例如，與.string attribute：

print h2_data.string

您可以使用CSS selector簡化搜索：

for h2_data in soup.select("div.innerContainer h2"): 
    print h2_data.string

來源

2015-02-09 22:25:17

感謝...的Martijn ..我解決了問題... – user3290624 2015-02-10 01:28:42

如何使用beautifulsoup4從html數據中刪除h2標籤？

回答

相關問題