2013-02-06 11 views
0

我想找到一個很好的方法來返回一個url頁面中的值。Python獲取下一行以下某個條件

我想要的每次 「跨類=」 按鈕」被列爲我可以抓住下一行

 
"span class=" button" 
0.87 

我想獲得0.87

我想:

import urllib 

url = 'http://test.com' 
sock = urllib.urlopen(url) 
content = sock.read().splitlines() 
sock.close() 

for i in content: 
    i = i.strip() 

這是我卡住的地方,我如何獲得下一行?

+0

HTML不需要線 - 你的例子也很垃圾 - 見@ dm03515的回答和我的評論 –

回答

2

如果這是HTML,您可以使用html p像BeautifulSoup

buttons = soup.findAll('span', {'class': 'button'}) 
for button in buttons: 
    button.nextSibling 

這款採用nextSibling這看起來arser已更改爲next_sibling在最新版本的好湯?

Python有一個內置的HTMLParser 如果你的數據是

<span class="button"> 
0.87 
</span> 

,你可以創建一個類像example

+0

你知道無論如何做這個沒有美麗的湯嗎? –

+0

@AdamG。你問是否有一種方法可以在不使用HTML解析器的情況下解析格式不正確的HTML數據(至少可以做出最好的猜測)! –

+0

是的,我可以得到下一行的HTML而不使用BS4? –