我想從html格式的網站刮刮鬍子。我用美麗的湯。這是html的一部分。Python美麗的湯刮從網頁上的網址
<li style="display: block;">
<article itemscope itemtype="http://schema.org/Article">
<div class="col-md-3 col-sm-3 col-xs-12" >
<a href="/stroke?p=3083" class="article-image">
<img itemprop="image" src="/FileUploads/Post/3083.jpg?w=300&h=160&mode=crop" alt="Banana" title="Good for health">
</a>
</div>
<div class="col-md-9 col-sm-9 col-xs-12">
<div class="article-content">
<a href="/stroke">
<img src="/assets/home/v2016/img/icon/stroke.png" style="float:left;margin-right:5px;width: 4%;">
</a>
<a href="/stroke?p=3083" class="article-title">
<div>
<h4 itemprop="name" id="playground">
Banana Good for health </h4>
</div>
</a>
<div>
<div class="clear"></div>
<span itemprop="dateCreated" style="font-size:10pt;color:#777;">
<i class="fa fa-clock-o" aria-hidden="true"></i>
09/10 </span>
</div>
<p itemprop="description" class="hidden-phone">
<a href="/stroke?p=3083">
I love Banana.
</a>
</p>
</div>
</div>
</article>
</li>
我的代碼:
from bs4 import BeautifulSoup
re=requests.get('http://xxxxxx')
bs=BeautifulSoup(re.text.encode('utf-8'), "html.parser")
for link in bs.find_all('a') :
if link.has_attr('href'):
print (link.attrs['href'])
結果會打印出所有從該頁面的URL,但是這不是我所期待的,我只想要一個特別的人喜歡「/行程? p = 3083「在這個例子中,我怎樣才能在python中設置條件? (我知道這裏共有三個「/ stroke?p = 3083」,但我只需要一個)
另一個問題。此網址不完整,我需要將它們與「http://www.abcde.com」合併,因此結果將爲「http://www.abcde.com/stroke?p=3083」。我知道我可以在R中使用粘貼,但是如何在Python中執行此操作?提前致謝! :)