1
>>> soup = BeautifulSoup('<div class="class1 class2 class3">...</div>','lxml')
>>> soup.find('div')['class']
['class1', 'class2', 'class3']
如何強制BS4將類名稱視爲單個字符串?BeautifulSoup4類與空格不被視爲單個字符串
>>> soup = BeautifulSoup('<div class="class1 class2 class3">...</div>','lxml')
>>> soup.find('div')['class']
['class1', 'class2', 'class3']
如何強制BS4將類名稱視爲單個字符串?BeautifulSoup4類與空格不被視爲單個字符串
您可以使用xml
作爲解析器:
soup = BeautifulSoup('<div class="class1 class2 class3">...</div>',"xml")
print(soup.find('div')['class'])
class1 class2 class3
或者你可以刪除'class'
從builder.cdata_list_attributes['*']
:
del BeautifulSoup().builder.cdata_list_attributes["*"][0]
soup = BeautifulSoup('<div class="class1 class2 class3">...</div>')
print(soup.find('div')['class'])
class1 class2 class3
相關(或者可能是重複的):http://stackoverflow.com/問題/ 34295928 /禁用,特殊類屬性的處理。 – alecxe