2016-08-17 43 views
-1

從下面的URL我需要提取img標籤裏面有類「所有者」的div的圖像源。具有結構使用美麗的湯提取圖像源

foodily.com

如下:

<div class="owner"> 
     <a href="/u/celinesteen"> 
      <img src="http://img07.foodily.net/img/50x50/6c4b366907eb.jpg"></a> 
     <div class="data"> 
      <div class="name">By 
      <a data-ftrack="{&quot;a&quot;:&quot;SU&quot;,&quot;b&quot;:&quot;SULT&quot;,&quot;c&quot;:&quot;Have Cake Will Travel&quot;}" class="_track" rel="nofollow" target="_blank" href="/u/celinesteen">Have Cake Will Travel</a> 
      </div> 
     </div> 
</div> 

我曾嘗試:

soup.find('div', {"class": "owner"}).findChildren('img') 

,並返回我的整體形象,而不是標籤我只是需要它裏面源。

回答

1

findChildren返回一個標籤數組。嘗試從那些得到src屬性:

images = s.find('div', {"class": "owner"}).findChildren('img') 
for img in images: 
     img.get('src') 

打印:

'http://img07.foodily.net/img/50x50/6c4b366907eb.jpg' 

檢查documentation以獲得更多信息。

+0

謝謝。你的和alecxe的答案都是對的。 – Simer

+0

'findChildren'回到bs2天,使用find_all http://stackoverflow.com/a/38839074/2141635 –