我正在嘗試從HTML文件中過濾某些數據。例如,HTML文件如下:如何使用Python過濾來自文件的數據?
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[ ]">software_0.1-0.log</td><td align="right">17-Nov-2009 13:46 </td><td align="right">186K</td></tr>
我需要提取software_0.1-0部分以及2009年11月17日部分。我怎樣才能做到這一點?
非常感謝。
從這個例子中,我們不太清楚過濾標準是什麼 - 看起來它可能是''標籤'之間的文本,但是這不太合適(有一個'186K'似乎並不想要)。你能再詳細一點嗎? – 2009-12-12 21:17:09