2
我試圖抓住表格從這個網頁。我不確定是否抓取了正確的標籤。這是我到目前爲止。Python beautifulsoup抓取表
from bs4 import BeautifulSoup
import requests
page='http://www.airchina.com.cn/www/en/html/index/ir/traffic/'
r=requests.get(page)
soup=BeautifulSoup(r.text)
test=soup.findAll('div', {'class': 'main noneBg'})
rows=test.findAll("td")
是main noneBg
表?當我將鼠標懸停在該標籤上時,它確實會突出顯示錶格?
'print cell.text UnicodeEncodeError:'gbk'編解碼器無法對字符u'\ xa0'進行編碼3:非法多字節序列'在最後一行出現此錯誤。 – jason
@jason_cant_code在'cell.text'幫助文件中調用'decode('utf-8')'? – alecxe
對不起,我是初學者。代碼是什麼樣的? 'cell.text.decode('utf-8')。split()'? – jason