2013-05-04 77 views
0

我想要BeautifulSoup查找具有某個類的html頁面中的所有元素。但他們也可以有額外的課程。例如:查找包含特定類的所有html元素

soup.findAll('tr', {'class': 'super_class1'}) 

此代碼僅發現tr其只有super_class1。但我想它找到所有tr其含有該類這樣

<tr class='super_class1'>aaa</tr> 

<tr class='super_class1 super_class2'>bbb</tr> 

<tr class='super_class1 super_class15 super_class16'>ccc</tr> 

回答

1

這是(https://bugs.launchpad.net/beautifulsoup/+bug/410304)已經修正了一個錯誤;問題基本上是湯不能識別班級名稱中的空格。

但是,如果你必須使用一個版本沒有修復,上面的鏈接也提供瞭解決方案:

soup.findAll(True, {'class': re.compile(r'\bsuper_class1\b')}) 
相關問題