BeautifulSoup找不到標籤li

import re 
from bs4 import BeautifulSoup 

>>>html_text = '<li>Location:<a href="tweetLocation">tweetLocation</a></li>' 
>>>soup = BeautifulSoup(html_text) 
>>>print soup.find('li', text=re.compile(r'^Location.*'))

我得到的答案爲none。誰能告訴我如何找到？BeautifulSoup找不到標籤li

來源

2017-06-20 user2492135

的可能的複製[BeautifulSoup - 通過文本標籤內搜索（https://stackoverflow.com/questions/31958637/ beautifulsoup搜索按文本內，一個標籤） –

text參數（現在命名爲string）實際上檢查以匹配期望的標準的元件的.string - 在這種情況下，正則表達式^Location.*。現在

，有什麼特別的.string屬性 - 它的價值將是None如果一個標籤有多個孩子：

如果一個標籤包含一個以上的事情，那麼目前還不清楚是什麼 .string應參照，所以.string被定義爲無

而且，你li元素實際上已經多個孩子 - 一個文本節點Location:和a元素。因此，沒有結果。

相反，找到的文本元素，然後獲得所需的元素：

In [1]: import re 

In [2]: from bs4 import BeautifulSoup 

In [3]: html_text = '<li>Location:<a href="tweetLocation">tweetLocation</a></li>' 

In [4]: soup = BeautifulSoup(html_text, "html.parser") 

In [5]: soup.find(text=re.compile(r'^Location.*')).find_parent('li') 
Out[5]: <li>Location:<a href="tweetLocation">tweetLocation</a></li> 

In [6]: soup.find(text=re.compile(r'^Location.*')).next_sibling.get_text() 
Out[6]: 'tweetLocation'

來源

2017-06-20 11:55:31 alecxe

BeautifulSoup找不到標籤li

回答

相關問題