我試圖拉亞馬遜搜索所有產品的標題。 它的工作原理,但結果只是讓我回到頁眉和頁腳亞馬遜鏈接。Python Beautifulsoup奇怪的結果
如果我檢查亞馬遜的源代碼上的元素,它看起來像產品標題是''標籤包裝在錨點。但是,在試圖抓取數據時並不是這種情況。
import requests
import re
from bs4 import BeautifulSoup
def adverts_trade(max_pages):
page = 1
while page <= max_pages:
url = 'https://www.amazon.co.uk/s/ref=sr_pg_2?rh=n%3A560798%2Cn%3A560834%2Ck%3Acanon+lenses&page=' + str(page) + '&keywords=canon+lenses&ie=UTF8'
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, "html.parser")
for link in soup.findAll('a'):
#href = link.find('h2').get_text()
print(link)
page += 1
adverts_trade(10)
我很驚訝,除硒以外沒有更簡單的解決方法 – user2331566
亞馬遜花費大量資金獲得優質圖像,產品屬性並實時動態調整價格。他們需要儘可能讓競爭對手抓取這些數據。幾乎所有主要的電子商務網站都盡其所能防止刮蹭。 – Chris