我有一個<td>
,並希望從中提取文本,這是我需要的只是文本湯姆·克魯斯,辛普森,比爾·克林頓這是使用一個Python正每個<td>
標籤內表達。提取文本
<td class="clic-cul manga" template=".woxColumnyd" maz="/ajax/blac-woxm/xom-line/expanded/2002-2012/11-05-2022/01/fam.json">Tom Cruz</td>
<td class="clic-cul manga" template=".woxColumnx" mac="/ajax/blac-woxm/xom-line/expanded/2002-2012/11-05-2022/01/fam.json">Home Simpson</td>
<td class="clic-cul manga" template=".woxColumnz" max="/ajax/blac-woxm/xom-line/expanded/2002-2012/11-05-2022/01/fam.json">Bill Clinton</td>
任何想法?
更新1.如果HTML解析器是標準方式,我應該怎麼做呢?
[不解析與正則表達式的HTML!(http://stackoverflow.com/a/1732454/418066) – Biffen
的標準方法是使用HTML解析器和不是一個正則表達式 – polku