我正在使用python 3來刮一個網站並打印一個值。這裏是代碼正則表達式使用正則表達式不拋棄任何結果嗎?
import urllib.request
import re
url = "http://in.finance.yahoo.com/q?s=spy"
hfile = urllib.request.urlopen(url)
htext = hfile.read().decode('utf-8')
regex = '<span id="yfs_l84_SPY">(.+?)</span>'
code = re.compile(regex)
price = re.findall(code,htext)
print (price)
當我運行這個片段,它打印一個空的列表,即。 []
,但我期待一個值,例如483.33
。
我錯了什麼?幫助
請_please_不要使用正則表達式解析HTML。使用('* gasp!*')HTML解析器。 –
Matt,爲什麼我們不能使用正則表達式?最新問題 – Shivamshaz
它不是你可以使用它,它只是有WAAAAY更好的預製,內置的工具已經用於解析這種類型的東西。檢查[this](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?lq=1)在網頁的源代碼中發佈 – TehTris