2015-12-19 13 views
1
>>> soup = BeautifulSoup('<div class="class1 class2 class3">...</div>','lxml') 
>>> soup.find('div')['class'] 
['class1', 'class2', 'class3'] 

如何強制BS4將類名稱視爲單個字符串?BeautifulSoup4類與空格不被視爲單個字符串

+0

相關(或者可能是重複的):http://stackoverflow.com/問題/ 34295928 /禁用,特殊類屬性的處理。 – alecxe

回答

1

您可以使用xml作爲解析器:

soup = BeautifulSoup('<div class="class1 class2 class3">...</div>',"xml") 
print(soup.find('div')['class']) 
class1 class2 class3 

或者你可以刪除'class'builder.cdata_list_attributes['*']

del BeautifulSoup().builder.cdata_list_attributes["*"][0] 

soup = BeautifulSoup('<div class="class1 class2 class3">...</div>') 
print(soup.find('div')['class']) 
class1 class2 class3 
相關問題