Possible Duplicate:
using python, Remove HTML tags/formatting from a stringPython:如何從文本字符串中刪除HTML標頭?
我在一個HTML文件中讀取:
fi = open("Tree.html", "r")
text = fi.read()
我想從文本中刪除HTML頭:
text = re.sub("<head>.*?</head>", "", text)
爲什麼這個不行?
Possible Duplicate:
using python, Remove HTML tags/formatting from a stringPython:如何從文本字符串中刪除HTML標頭?
我在一個HTML文件中讀取:
fi = open("Tree.html", "r")
text = fi.read()
我想從文本中刪除HTML頭:
text = re.sub("<head>.*?</head>", "", text)
爲什麼這個不行?
你可以從你的HTML文件發佈標題部分。 –
必須閱讀此答案:http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –