我想解析網頁http://dcsd.nutrislice.com/menu/meadow-view/lunch/搶今天的午餐菜單。 (我已經構建了一個Adafruit#IoT熱敏打印機,並且我想每天自動打印菜單。)解析從BeautifulSoup返回的JavaScript
我最初使用BeautifulSoup來解決這個問題,但事實證明,大部分數據都是用JavaScript加載的,而我我不確定BeautifulSoup能處理它。如果您查看源代碼,您將看到存儲在bootstrapData['menuMonthWeeks']
中的相關數據。
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://dcsd.nutrislice.com/menu/meadow-view/lunch/"
soup = BeautifulSoup(urllib2.urlopen(url).read())
這是獲取源代碼和評論的簡單方法。
我的問題是:什麼是最簡單的方法來提取這些數據,以便我可以做些什麼?從字面上看,我要的是一個字符串一樣的東西:
西南奶酪煎蛋卷,土豆角,收穫吧(THB)泰銖 - 芝士香蒜麪包,火腿熟食三明治,紅辣椒棒,草莓
我想過使用webkit來處理頁面並獲取HTML(即瀏覽器的功能),但似乎不必要的複雜。我寧願找一些可以解析數據的東西。
非常有幫助!需要更多的導入和URL定義,但最終這也很適合獲得該值。 – Wade