所以我刮的網站,並試圖輸出這些span標籤之間到底是(這將取決於我湊什麼網址更改)Python 2.7版解析正則表達式
<span class="inviter-name">tickzapman12345</span>
import urllib2
import re
url = "http://beta.cursevoice.com/join/jt95"
req = urllib2.Request(url)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.5) Gecko/20091102 Firefox')
response = urllib2.urlopen(req)
matchObj = re.search(r'<span class="inviter-name">(.*?)</span>',str(response))
f = open('output.txt','w')
f.write(str(matchObj))
f.close()
然而,當我檢查輸出文件,它只是說「無」,是我的正則表達式的錯誤?
'matchObj = re.search(R '<跨度類= 「邀請者名」>(。*?)',STR(響應))。組() ' –
AttributeError:'NoneType'對象沒有屬性'group' –