我無法解析這個網站上正確的HTML:https://nwis.waterdata.usgs.gov/usa/nwis/gwlevels/?site_no=332857117043301解析HTML的網站刮
我想提取行「北緯34°02'48.57」,東經117°02'09.16" 。雖然這在管路862頁面的源代碼(網頁開發工具)顯示出來,它不顯示,當我通過BeautifulSoup解析。使用lxml的分析器不產生任何所需的結果。
import requests
import re
from bs4 import BeautifulSoup
page = requests.get('https://nwis.waterdata.usgs.gov/usa/nwis/gwlevels/?site_no=340248117020902')
soup = BeautifulSoup(page.content, 'html.parser')
print (soup.prettify())
我打印聲明頁面內容不顯示緯度/經度線。如何調整我的代碼以刮取此信息?
謝謝維尼修斯。我假定當我通過「print(soup(prettify())」打印頁面內容時會出現內容。「你能解釋爲什麼它不會顯示在那裏,但通過findall方法工作? – saoirse
我很高興(https://meta.stackexchange.com/a/5235)當我嘗試你的代碼時,它也顯示在'print(soup)'中],也可以選擇最有幫助的答案並[接受它] ,因爲它應該,你有沒有試圖再次這樣做? –
我試過了,打印語句不顯示它。我的結果html有814行,這聽起來是對的嗎? – saoirse