我有一堆HTML,我每週從網站下載一次,需要抓取它的一些信息,不知道從哪裏開始。python找到一個字符串&前後的所有內容
我有大約100個這樣的文件重複,只想抓住2條線。
NUMBER2 ‑ ‑計算機
天 前 上 君 22, 11589文件/ 4,363 MB
<td width="242"><div align="left"><span class="style9">
<span class="style9"><img src="pic.pn" width="32" height="32" border="0" style="vertical-align:text-top;" />number2 ‑‑computer</span><br />
.....
<div align="left">License:<br />Backup:<br />Files:</div></td><td width="186" valign="top" nowrap><div align="left" nowrap>
<span class="black" nowrap><span class="black">Paid Unlimited</span>
<br />3 days ago on Jun 22, 12<br />11,589 files/4,363 MB</span></td>
<td width="92" valign="top"> </td></tr>
.....
</div></td>
[你嘗試過什麼?](http://whathaveyoutried.com) – millimoose
你想要一個HTML解析器 - 這種情況下,我會建議BeautifulSoup。 –
@millimoose:顯然他到目前爲止還沒有嘗試過任何東西,比如「不確定從哪裏開始」 –