2011-07-12 15 views
-2

我是Python的新手。我有一個HTML文件,我需要做一些「使用正則表達式查找和替換操作」。做這個的最好方式是什麼?使用Python的HTML文件中的字符串和正則表達式操作

我可以將HTML文件的內容作爲字符串獲取嗎?或者,還有更好的方法?

+2

「這樣做的最佳方法是什麼?」不要使用正則表達式。最好的辦法是(1)在這裏搜索這個問題的重複。 (2)使用美麗的湯,這是所有重複的答案。 –

+1

-1今天要求第三個HTML解析+正則表達式問題...請在研究之前詢問一下。要求使用正則表達式進行HTML解析總是會給你許多downvotes。 –

回答

5

看看像Beautiful Soup這樣的HTML解析器。 使用正則表達式解析HTML是a bad idea

編輯:

美麗的湯許可:

美麗的湯是根據相同的條款許可爲Python本身

Pythons license

注意: GPL兼容並不意味着我們正在GPL下分發Python。與GPL不同,所有Python許可證都允許您分發修改後的版本,而無需將您的更改作爲開源代碼。 GPL兼容許可證可以將Python與其他根據GPL發佈的軟件結合使用;其他人沒有。

+0

[html5lib](http://code.google.com/p/html5lib/)也不是一個錯誤的決定。 – Pill

+0

@cularis我將使用此腳本進行分發。所以如果我使用漂亮的肥皂或html5lib,它是否可行的部署? – thinkcool

相關問題