使用Beautiful Soup模塊,如何獲取div
標籤的數據,該標籤的類名是feeditemcontent cxfeeditemcontent
?它是:使用Beautiful Soup獲取課程名稱和內容
soup.class['feeditemcontent cxfeeditemcontent']
或:
soup.find_all('class')
這是HTML源代碼:
<div class="feeditemcontent cxfeeditemcontent">
<div class="feeditembodyandfooter">
<div class="feeditembody">
<span>The actual data is some where here</span>
</div>
</div>
</div>
,這是Python代碼:
from BeautifulSoup import BeautifulSoup
html_doc = open('home.jsp.html', 'r')
soup = BeautifulSoup(html_doc)
class="feeditemcontent cxfeeditemcontent"
'classes = dict(tag.attrs).get('class','')'比'try''除了'block'要短得多,它的功能是一樣的。 –
@DoronCohen是否需要「dict()」?似乎沒有工作。 – Mark
@Mark我得到一個沒有'dict()'的異常,因爲它是一個列表'TypeError:列表索引必須是整數,而不是str'。此外,這個答案假設美麗的湯3(可能是爲什麼你看到不同的結果),你應該使用版本4,並使用其他答案。 – jadkik94