6
我有一個HTML文件集合。我希望一個一個地遍歷它們,編輯特定類的標記。我想編輯的代碼是以下形式,使用下面的類名稱:用BeautifulSoup中的另一個標籤替換一種標籤
<td class='thisIsMyClass' colspan=4>
<a id='123' class='thisIsMyOtherClass' href='123'>Put me Elsewhere</a>
這可以在同一文檔中出現多次,用不同的文本,而不是「把我在別處」,但始終不變類。
我想改變這是下面的形式:
<font SIZE="3" COLOR="#333333" FACE="Verdana" STYLE="background-color:#ffffff;font-weight: bold;">
<h2>Put Me Elsewhere</h2>
</font>
import os
for filename in os.listdir('dirname'):
replace(filename)
def replace(filename):
tags = soup.find_all(attrs={"thisIsMyClass"})
不太清楚在這之後去哪裏或如何處理標籤陣列?任何幫助將非常感激。謝謝:)
HTML對
回答
好得多,更漂亮將是一個佔位符準備替換HTML字符串,找到所有
td
標籤與thisIsMyClass
類,並使用.replace_with()
來代替每個:打印:
來源
2014-12-03 22:12:19 alecxe
這就像分配給
name
屬性一樣簡單。另外documentation是你的朋友。這是相當全面的。
來源
2014-12-02 03:14:24 ento
相關問題