如何提取python中的屬性值？

我有一個HTML文件說：如何提取python中的屬性值？

<html>... 
    <li id="123"></li> 
    <li id="3455"></li> 
    .... 
</html>

我怎麼使用BeautifulSoup了獨自一人的ID在python的價值？所需的輸出是：["123","3455"]

來源

2012-07-13 abhixec

爲了得到你想要的清單，使用list comprehension。它可以在一行完成如下（最後一行）：

html = '<html> <li id="123"></li><li id="3455"></li> </html>' 
soup = BeautifulSoup(html) 

attrs = [li['id'] for li in soup.find_all('li')]

來源

2012-07-13 23:26:53 Ansari

謝謝，這就是我一直在尋找。 – abhixec 2012-07-13 23:52:57

不客氣@Abhinav - 我看到了你的編輯，但'find_all'是BeautifulSoup的當前語法，而BS3則是findAll，但它也適用於BS 4。 – Ansari 2012-07-14 00:12:56

好的！我使用bs3我猜...所以它不適合我，很高興知道這一點。 – abhixec 2012-07-16 16:37:03

from BeautifulSoup import BeautifulSoup 

foo = '<html> <li id="123"> </li> <li id="3455"></li> </html>' 

soup = BeautifulSoup(foo) 

for id in soup.html.findAll('li'): 
    print id['id']

來源

2012-07-13 23:21:43

如何提取python中的屬性值？

回答

相關問題