BeautifulSoup：從ResultSet中的findAll

剝離HTML標籤我試圖從soup.html.body.findAll('td', {'class':'yfnc_h'})BeautifulSoup：從ResultSet中的findAll

ResultSet中去除所有的HTML標籤目前，ResultSet中有時會包含嵌套<a href>，<td>，等標籤。我發現的對ResultSet（而不是湯對象）起作用的唯一半解決方案是RSelement.string

但是，.string無法處理具有多個嵌套標記的輸入，例如，

輸入：<td class="yfnc_h" align="right">53.50</td>

輸出：53.50

輸入：<td class="yfnc_h" align="right">51.97</td>

輸出：None

輸入：<td class="yfnc_h" align="right"> 0.00</td>

輸出：無

如何從ResultSet輸出中去除所有標記？

2013-10-31 Jack Huang

是顯示您所需的輸出輸出？ –

不，上面的輸出是實際的錯誤輸出。我想顯示53.50; 51.97; 0.00 –

使用.text屬性改爲：

print RSelement.text

2013-10-31 05:14:23 TerryA

print RSelement.text給了我所有的「無」結果。 –

@JackHuang當我做'BeautifulSoup（'51.97'）.text'時，你使用的是什麼版本的BeautifulSoup – TerryA

好吧，這很奇怪。我得到「無」印刷'確切的代碼。 –

回答