我知道問題標題並不是很了不起,但我想不出一個更好的方式來表達它。我有一點HTMl,我需要搜索:從HTML中解析特定信息的最簡單方法
<tr bgcolor="#e2d8d4">
<td>1</td>
<td>12:00AM</td>
<td>Show Name<a name="ID#"></a></td>
<td>Winter 12</td>
<td>Channel</td>
<td>Production Company</td>
<td nowrap>1d 11h 9m (air time)</td>
<td align="center">11</td>
<td>
<a href="link">AniDB</a></td>
<td><a href="link">Home</a></td>
</tr>
該頁面是幾十個這些html塊。我需要能夠用Show Name來選擇給定節目的播放時間,以及bgcolor。 (整頁在這裏:http://www.mahou.org/Showtime/Planner/)。我假設最好的賭注是一個正則表達式,但我對這個假設沒有信心。我寧願不使用第三方模塊(BeautifulSoup)。如果問題很模糊,我很抱歉。
不要使用正則表達式來解析html。 BeautifulSoup實際上就是你需要的。 – EwyynTomato 2012-03-16 04:17:09
至少使用[HTMLParser](http://docs.python.org/library/htmlparser.html),但我更喜歡'lxml'或'beautifulsoup'。 [使用正則表達式解析器HTLM是壞](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags) – Dikei 2012-03-16 04:17:42