0
我想從下面的代碼中提取「1381912680」:檢索CSS選擇器的內容
[<abbr class="timestamp" data-utime="1381912680"></abbr>]
使用Python 2.7,這是我目前在我的代碼去那個階段:
s = soup.find_all("abbr", { "class" : "timestamp" })
print s
我應該使用正則表達式還是BS可以自己做它?
編輯
我試圖使用正則表達式,但沒有運氣:
import re
regex = 'data-utime=\"(\d+)\"'
x = re.compile(regex)
x2 = re.findall(x, s)
print x2
我:類型錯誤:預期的字符串或緩衝區
正則表達式似乎很好,如果你知道所有的''將無子女。如果是這種情況,請使用'data-utime = \「(\ d +)\」'來允許交換屬性。 – AlexR
我認爲這個線程可能會幫助你:http://stackoverflow.com/questions/19602398/python-beautiful-soup-content-property – pazitos10
感謝您的幫助球員,我試圖申請正則表達式,但沒有運氣,你可以請有一個看看編輯後的qn。 – user3374113