2014-03-05 32 views
0

我好像刮表被卡住,如果我下面的表有:與beautifulsoup

<table align=center cellpadding=3 cellspacing=0 border=1> 
<tr bgcolor="#EEEEFF"> 
    <td align="center"> 
    40 </td> 
    <td align="center"> 
    44 </td> 
    <td align="center"> 
    <font color="green"><b>+4</b></font> 
    </td> 
    <td align="center"> 
    1,000</td> 
    <td align="center"> 
    15,000 </td> 
    <td align="center"> 
    44,000 </td> 
    <td align="center"> 
    <font color="green"><b><nobr>+193.33%</nobr></b></font> 
    </td> 

</tr> 

什麼是使用find_all拉從表中的4.4萬名TD的理想方式?

+1

「44,000」表格單元與其他單元格有什麼區別?爲什麼具體的價值? –

回答

1

如果它是一個反覆出現的表格,你想刮,你想刮,我會用美麗的湯提取表中的所有元素,然後提取該數據。請參閱下面的僞代碼。

known_position = 5 
tds = bs4.find_all('td') 
number = tds[known_position].text() 

另一方面,如果你正在尋找一個給定的數字,我只是遍歷列表。

tds = bs4.find_all('td') 
for td in tds: 
    if td.text = 'number here': 
     # do your stuff