2014-06-24 44 views
1

我是新來的,有這個麻煩,如果有人能夠準確地告訴我我要去哪裏錯(而不僅僅是一個解決方案) 。試圖(和失敗)從谷歌金融使用蟒蛇美麗的湯颳去財務數據

到目前爲止,這是相當不言自明......

import urllib2 
from bs4 import BeautifulSoup 

url = 'http://www.google.co.uk/finance?q=NASDAQ%3AAAPL&fstype=ii&ei=_dupU6DgFMTGwAPR6YHQDA' 
page = urllib2.urlopen(url) 
soup = BeautifulSoup(page) 

我找的數據是很容易找到:

soup.find.all("tr",{"class":"hilite"}) 

在控制檯輸入原來所有的正確信息

我被卡住的地方是如何將它工作到for循環(我是編程的新手)。

我知道我的標題是1td class =lft lm bld,我的數據是td class = rbld,但我真的不知道如何將其存入數組。任何幫助理解背後的概念都會很棒。

回答

0

最簡單的例子就是遍歷tr標籤和使用find_all()獲得td標籤的每一行:

for row in soup.find_all("tr", {'class': "hilite"}): 
    for cell in row.find_all('td'): 
     print cell.text 
    print "-----" 

打印:

Total Revenue 

45,646.00 
57,594.00 
37,472.00 
35,323.00 
43,603.00 
----- 
Gross Profit 

17,947.00 
...