1
我想從這個網頁刮數據標籤:http://www.kitco.com/texten/texten.html如何湊網頁缺乏使用BeautifulSoup
這裏是我使用的代碼:
import requests
from bs4 import BeautifulSoup
url = "http://www.kitco.com/texten/texten.html"
r = requests.get(url)
# Doing this to force UFT-8 encoding. Not sure if this is needed...
r.encoding = "UTF-8"
soup = BeautifulSoup(r.content)
tag = soup.find_all("London Fix")
print tag
正如您看到的,而查看該頁面的來源,術語「倫敦修復」是不是在任何標籤 - 我不知道這是否是cdata或什麼...
任何想法如何解析這些表?
如果您正在使用的是r.content,則確實不需要設置r.encoding。順便說一句,這是完全正確的。 – 2014-08-29 17:20:21
我認爲這太寬泛了,但我也可以證明'你不清楚你問的是什麼',因爲你沒有指定你期望的輸出。 – 2014-08-29 17:21:45
我建議你開始閱讀[BeautifulSoup文檔](http://www.crummy.com/software/BeautifulSoup/bs4/doc/)更仔細一點,看看'soup.find_all()'*做*,作爲好。 – 2014-08-29 17:22:26