的HTML如下:如何使用beautifulsoup4提取html?
<td class='Thistd'><a ><img /></a>Here is some text.</td>
我只是想在<td>
的字符串。我不需要<a>...</a>
。 我該怎麼做?
我的代碼:
from bs4 import BeautifulSoup
html = """<td class='Thistd'><a><img /></a>Here is some text.</td>"""
soup = BeautifulSoup(html)
tds = soup.findAll('td', {'class': 'Thistd'})
for td in tds:
print td
print '============='
我得到的是<td class='Thistd'><a ><img /></a>Here is some text.</td>
但我只需要Here is some text.
之間的是什麼,你得到了什麼,你想 – The6thSense
對不起有什麼區別,有一些錯誤,現在已經修復。 –