2016-06-19 86 views
4

我正在用Python 3.4中的BeautifulSoup進行一些網絡抓取。BeautifulSoup只提取頂級標籤

現在我在學習期間遇到了一個問題: 我試圖從網頁獲取表格行,我使用find_all()來獲取它們,但在表格內部 - 有更多的表格和表格裏面的行!我怎樣才能得到只有 BeautifulSoup中的標籤的頂級/一級通用或特定元素?

# Retrieves all the row ('tr') tags in table 
my_table.find_all('tr') 

順便說一句,這個問題是這個問題的重複(僅用於那邊的編程語言PHP):Extract only first level paragraphs from html

回答

8

顯然有一種說法在方法find_all稱爲遞歸 (),默認設置爲True

將其設置爲false,使該方法僅返回頂層元素。

find_all('tr', recursive=False) 
相關問題