我有一個簡單的HTML文件,我想要轉換。根據類的標籤,我需要modifiy內容:我是否有「H1」或「P」或其他類的如何從元素中獲取名稱美麗的湯4已解析
<HTML>
<HEAD>
<TITLE>Eine einfache HTML-Datei</TITLE>
<meta name="description" content="A simple HTML page for BS4">
<meta name="author" content="Uwe Ziegenhagen">
<meta charset="UTF-8">
</HEAD>
<BODY>
<H1>Hallo Welt</H1>
<p>Ein kurzer Absatz mit ein wenig Text, der relativ nichtssagend ist.</p>
<H1>Nochmal Hallo Welt!</H1>
<p>Schon wieder ein kurzer Absatz mit ein wenig Text, der genauso nichtssagend ist wie der Absatz zuvor.</p>
</BODY>
</HTML>
我如何可以順利通過BS4樹,做取決於某些修改標籤?我想我需要一些switch語句來決定每個元素如何處理它。
from bs4 import BeautifulSoup
with open ("simple.html", "r") as htmlsource:
html=htmlsource.read()
soup = BeautifulSoup(html)
for item in soup.body:
print(item)
注意。這意味着要在標籤元素上調用。如果在文檔上調用,它也會修改'
'及其子元素,''元素和整個文檔('BeautifulSoup'對象)。 –