0
我使用bs4從站點獲取一些href。beautifulsoup4:獲得href,但返回「#」
<a class="aaa" target="12345" href="someURL"
data-track="HOT:SR:HotelModule" tabindex="0">
<span class="visuallyhidden">
some text here
</span>
</a>
HTML就像上面那樣。 我可以使用此代碼得到大部分的URL:
for URL in res.select('.someClass')
URL.select('a')[0]['href']
但一些返回值是# 我已經檢查了網站的源代碼,我發現href是真的在這裏,它不是#。
有什麼問題讓我得到#但沒有網址?我想要的是the website。 我的問題發生在+ VIP標籤的酒店。
哦!我發現在我的目標href的同一個類中有一個href =「#」,它在我的目標前面,所以我得到了一個#而不是我的目標。謝謝。 –
哈哈,沒問題。 JavaScript可能會很棘手,因爲我看到你與它交互Selenium是一個非常有用的模塊,至少要看看它:D。 –