2010-07-20 29 views
1

的Python美麗的湯標籤爲表TD的Python美麗的湯標籤爲表TD

<td class="result" valign="top" colspan="3"> 

目前,以下不工作:

​​

四處錯誤:

HTMLParser.HTMLParseError: malformed start tag 
+0

你的湯是由一個完整的html頁面,或只是你的td線? – 2010-07-20 12:53:05

+0

它的整個頁面,以及td的列表 – bobsr 2010-07-20 13:04:24

回答

1

正如website所述,HTMLParser是quitefragile。您應該使用SGMLParser,因爲它對於格式錯誤的HTML更強大。

不幸的是,Python 3.0已經從標準庫中刪除了SGMLParser。有關建議的解決方法,請參閱上面的鏈接,例如使用html5lib