我已經搜索,但沒有找到適當的答覆。用美麗的湯解析時,刪除頭標籤之間的任何內容
url = "http://en.wikipedia.org/wiki/Bryan_Greenberg"
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
try:
ourUrl = opener.open(url).read()
soup = BeautifulSoup(ourUrl)
except Exception,err:
continue
dem = soup.findAll('p')
我剛剛複製了腳本的一部分。我如何刪除標題和標籤中放置的所有內容。所以它不會來湯。謝謝。
爲什麼要刪除該內容?在我看來,當抓取一個HTML文件時,我更感興趣的是找到一小部分要使用和使用的網頁,而不是找到它的一部分不使用。 – pandubear
我想要的一切。但我想刪除頭標記中的任何東西 – user2878953