2017-03-22 42 views
0

我使用bs4從站點獲取一些href。beautifulsoup4:獲得href,但返回「#」

<a class="aaa" target="12345" href="someURL" 
data-track="HOT:SR:HotelModule" tabindex="0"> 
     <span class="visuallyhidden"> 
     some text here 
     </span> 
</a> 

HTML就像上面那樣。 我可以使用此代碼得到大部分的URL:

for URL in res.select('.someClass') 
URL.select('a')[0]['href'] 

但一些返回值是# 我已經檢查了網站的源代碼,我發現href是真的在這裏,它不是#。

有什麼問題讓我得到#但沒有網址?我想要的是the website。 我的問題發生在+ VIP標籤的酒店。

回答

0

也許他們正在使用<a href="#" onclick="myJsFunc();">Link</a>,你確定沒有像這樣的href嗎? 而使用不同=解析器會產生不同的結果。 嘗試使用所有這些,檢查結果xmlhtml5libhtml.parser" Difference between parsers one <code>href</code> = #

+0

哦!我發現在我的目標href的同一個類中有一個href =「#」,它在我的目標前面,所以我得到了一個#而不是我的目標。謝謝。 –

+0

哈哈,沒問題。 JavaScript可能會很棘手,因爲我看到你與它交互Selenium是一個非常有用的模塊,至少要看看它:D。 –