from bs4 import BeautifulSoup
source = """
<div class="div1" style="direction:rtl;text-align:center;clear:both;margin:.1em;margin-bottom:1em;">
<div class="div2" style="direction:rtl;text-align:center;clear:both;margin:.1em;">
"""
soup = BeautifulSoup(source, 'lxml')
for div in soup.find_all('div'):
print div.get('style')
這會給你這樣的輸出:
direction:rtl;text-align:center;clear:both;margin:.1em;margin-bottom:1em;
direction:rtl;text-align:center;clear:both;margin:.1em;
現在這些都是str
對象。你可以按照你喜歡的方式將它們分成;
和格式。作爲認定屬性的數量,你可以接近這樣的:
for div in soup.find_all('div'):
print len(filter(None , div.get('style').split(';')))
輸出:
5
4
獲取樣式,從拆分';',算什麼? –
你嘗試了什麼? –