我只是碰到了一個與正則表達式的障礙,不知道爲什麼這不起作用。BeautifulSoup,簡單的正則表達式問題
下面是BeautifulSoup醫生說:
soup.find_all(class_=re.compile("itl"))
# [<p class="title"><b>The Dormouse's story</b></p>]
這裏是我的html:
<a href="exam.com" title="Keeper: Jay" class="pos_text">Aouate</a></span><span class="pos_text pos3_l_4">
,我試圖將span
標籤(最後一個位置)相匹配。
>>> if soup.find(class_=re.compile("pos_text pos3_l_\d{1}")):
print "Yes"
# prints nothing - indicating there is no such pattern in the html
所以,我只是重複BS4文檔,除了我的正則表達式不工作。果然,如果我將\d{1}
替換爲4
(如最初在html中),它會成功。
爲什麼會Ð需要逃避相匹配的正則表達式? – PuercoPop 2013-04-09 18:26:55
'd'不需要轉義。 '\\'需要轉義。 – 2013-04-09 18:27:44
@JoeFrambach說什麼。 – 2013-04-09 18:28:10