0
我是新來的使用美麗和刮一般,所以我試圖讓我的腳溼說話。python beautifulsoup4解析谷歌財務數據
我想從這裏得到的道瓊斯工業平均指數信息的第一行: http://www.google.com/finance/historical?q=INDEXDJX%3A.DJI&ei=ZN_2UqD9NOTt6wHYrAE
雖然我可以讀取數據,並打印(湯)輸出的一切,我似乎無法到放下足夠多。我將如何選擇我保存到表格中的行?第一排怎麼樣?
非常感謝您的幫助!
import urllib.parse
import urllib.request
from bs4 import BeautifulSoup
import json
import sys
import os
import time
import csv
import errno
DJIA_URL = "http://www.google.com/finance/historical?q=INDEXDJX%3A.DJI&ei=ZN_2UqD9NOTt6wHYrAE"
def downloadData(queryString):
with urllib.request.urlopen(queryString) as url:
encoding = url.headers.get_content_charset()
result = url.read().decode(encoding)
return result
raw_html = downloadData(DJIA_URL)
soup = BeautifulSoup(raw_html)
#print(soup)
table = soup.findAll("table", {"class":"gf-table historical_price"})
嗨,我應該使用.find和.find_all時? – user1357015
'.find()'僅查找* first *匹配或返回'None','.find_all()'返回0個或更多匹配的列表。 –
太好了。這真的有幫助。是row.th特定於beautifulsoup?以前從未見過。 – user1357015