0
當類屬性具有幾個不同的值之一時,我試圖獲取所有'td'標記的出現。使用SoupStrainer和BeautifulSoup獲取具有多個屬性的所有標記
我知道如何使用BeautifulSoup做到這一點後,但由於需要花費的時間,我試圖通過有選擇地解析每個頁面使用SoupStrainer來加速它。我起初嘗試了下面的內容,但似乎並不奏效。
strainer = SoupStrainer('td', attrs={'class': ['Value_One', 'Value_Two']})
soup = BeautifulSoup(foo.content, "lxml", parse_only=strainer)
有誰知道一個辦法,使這項工作(它沒有涉及SoupStrainer甚至美味的湯)?
用'湯= BeautifulSoup(urllib2.urlopen(URL), 'LXML')''然後soup.find_all( 'TD'))'應該找到所有''標籤,不是嗎? – davedwards
是的,我知道。但我只試圖解析文檔的一部分(具有少數可能的類屬性值的td標籤)。你的答案解析整個事物,然後選擇td標籤。我想一步完成它。 – Hobbit36