1
我想用bs4獲取兩個標記之間的HTML。有沒有辦法在美麗的湯做javascript的.innerHTML?從BeautifulSoup 4.6中的兩個HTML標記中提取HTML
這是找到類「標題」的範圍,並從中獲取文本的代碼。
def get_title(soup):
title = soup.find('span', {'class': 'title'})
return title.text.encode('utf-8')
該函數錯誤地返回沒有下標的範圍的文本。 'Title about H2O and CO2'
下面的代碼是title = soup.find('span', {'class': 'title'})
結果:
<span class="title">Title about H<sub>2</sub>O and CO<sub>2</sub></span>
我怎麼沒有原始跨度的結果呢?
預期結果:'Title about H<sub>2</sub>O and CO<sub>2</sub>'
?