我想知道是否有一個庫或Python中的某些方法從HTML文檔中提取元素。例如:在Python中刪除HTML塊
我有這個文件:
<html>
<head>
...
</head>
<body>
<div>
...
</div>
</body>
</html>
我想從文件塊內容一起刪除<div></div>
標籤塊,然後它會是這樣的:
<html>
<head>
...
</head>
<body>
</body>
</html>
你想只刪除''
標籤或這兩個標籤和內容的內容? –我想刪除它們之間的標籤和內容。但是隻有內容是好的:) – JefersonM
你可以嘗試讀取html文件作爲xml並刪除'div'節點。 https://wiki.python.org/moin/PythonXml建議使用* ElementTree * –