2015-04-02 180 views
1

我對Python很陌生。我試圖抓取一個網站的信息,主要是文字,但我遇到了日期問題。它看起來像這樣:使用BeautifulSoup獲取日期

<time class="jlist_date_image" datetime="2015-04-02 14:30:12">Idag <span class="list_date">14:30</span></time> 

我想從這裏得到的是「2015-04-02 14:30:12」。我的問題是它不是文字。任何人都可以幫助我。

謝謝!

+2

我看不出有什麼問題?你有一個具有特定'class'的'time'標籤。它包含'datetime'屬性。一個簡單的谷歌搜索和檢查文檔就足以解決你的問題。 – HamZa 2015-04-02 12:56:22

回答

0
>>> from bs4 import BeautifulSoup 
>>> s = '''<time class="jlist_date_image" datetime="2015-04-02 14:30:12">Idag <span class="list_date">14:30</span></time>''' 
>>> soup = BeautifulSoup(s) 
>>> for i in soup.findAll('time'): 
     if i.has_attr('datetime'): 
      print(i['datetime']) 


2015-04-02 14:30:12 
3
from bs4 import BeautifulSoup 

BeautifulSoup(strng).time.attrs['datetime']