假設我想使用BeautifulSoup解析html,我想使用css選擇器來查找特定的標籤。如果我想找到它的標籤做BeautifulSoup .select()方法是否支持正則表達式的使用?
from bs4 import BeautifulSoup
soup = BeautifulSoup(html)
我會「soupify」它「id」屬性爲「ABC」的值,我可以做
soup.select('#abc')
如果我想找到所有「一」我們目前的標籤下的子標籤,我們可以做
soup.select('#abc a')
但現在,假設我想找到所有的「一」的標籤,其「href」屬性的屬性具有在「XYZ」結尾值我會想使用正則表達式,我希望沿線的東西
soup.select('#abc a[href] = re.compile(r"xyz$")')
我似乎無法找到任何說BeautifulSoup的.select()方法將支持正則表達式。
這太棒了。在我的例子中,它只是爲了通用的情況。我要求提供正則表達式支持的原因是因爲我希望檢測到其他模式,可能會在開始,結束或中間發生。此外,我希望能夠檢測到不僅僅是xyz,而且還可以檢測不同數量的數字。 – lollerskates 2014-11-21 21:45:30