我是python和SO的新手。這是我的問題。如何使用BeautifulSoup提取html標籤之外的數據
我想從以下網頁NDBC - Station 46011.我一直在看關於如何使用BeautifulSoup從網頁收集數據的教程提取數據,我有以下代碼至今:
import requests
from bs4 import BeautifulSoup
url = 'http://www.ndbc.noaa.gov/data/latest_obs/46011.rss'
r = requests.get(url)
soup = BeautifulSoup(r.content)
data_types = soup.find_all('strong')
for item in data_types:
print(item.text)
這給了我不同的數據類型(風向,速度,陣風等)。但是,我無法從此網頁提取數字數據。當您查看網頁來源時,您可以看到數字數據位於'strong'標籤之後和'br'標籤之前。由於它沒有顯式地位於兩個標籤之間,因此無法提取此數據。
感謝您提前提供所有幫助!
你有看着如http://stackoverflow.com/q/8220732/3001761? – jonrsharpe 2014-09-28 08:02:24