2015-06-11 26 views
0

一個更簡單的問題...的Python美麗的湯刮具體的數字

使用下面的代碼,我怎麼刮的HTML標記,這樣的結果僅僅是一個數字?

我正在使用不同的網頁。

import pickle 
import math 
import urllib2 
from lxml import etree 
from bs4 import BeautifulSoup 
from urllib import urlopen 

favPrevGMInfoUrl = 'http://www.cbssports.com/nfl/gametracker/boxscore/[email protected]' 
favPrevGMInfoHtml = urlopen(favPrevGMInfoUrl).read() 
favPrevGMInfoSoup = BeautifulSoup(favPrevGMInfoHtml) 
favPrevGMInfo = favPrevGMInfoSoup.find_all("td", { "id" : "away-safeties" }) 

print favPrevGMInfo 

回答

1

改變你的最後的打印語句 -

print favPrevGMInfo[0].text 

或更改上面的線 -

favPrevGMInfo = favPrevGMInfoSoup.find("td", { "id" : "away-safeties" }).text 
1

本網站不返回原始URL中的GET請求的源,而通過AJAX調用JSON - http://www.nfl.com/feeds-rs/videos/byGameCenter/2014091404.json?gameState=POST&maxResult=0&random=1434035648930

您將需要從此調用中獲取數據。請使用網絡標籤來分析所有請求。

+0

@jcmcdonald,爲你做這項工作? –

+0

我已更新我的問題。我不知道該怎麼做,所以我正在使用不同的網頁。新網頁每個號碼都有一個「id」標籤,因此更容易。我只需要幫助從答案中剝離HTML。 – jcmcdonald