4
我正在用Python 3.4中的BeautifulSoup進行一些網絡抓取。BeautifulSoup只提取頂級標籤
現在我在學習期間遇到了一個問題: 我試圖從網頁獲取表格行,我使用find_all()來獲取它們,但在表格內部 - 有更多的表格和表格裏面的行!我怎樣才能得到只有 BeautifulSoup中的標籤的頂級/一級通用或特定元素?
# Retrieves all the row ('tr') tags in table
my_table.find_all('tr')
順便說一句,這個問題是這個問題的重複(僅用於那邊的編程語言PHP):Extract only first level paragraphs from html