即時通訊使用beautifulsoup4解析網頁,並使用此代碼如何解決,找出兩個的各個環節(Beautifulsoup,蟒蛇)
#Collect links from 'new' page
pageRequest = requests.get('http://www.supremenewyork.com/shop/all/shirts')
soup = BeautifulSoup(pageRequest.content, "html.parser")
links = soup.select("div.turbolink_scroller a")
allProductInfo = soup.find_all("a", class_="name-link")
print allProductInfo
linksList1 = []
for href in allProductInfo:
linksList1.append(href.get('href'))
print(linksList1)
linksList1打印兩各環節的收集所有的HREF值。我相信這是因爲它從標題以及項目顏色中獲取鏈接。我已經嘗試了一些東西,但不能讓BS只解析標題鏈接,並且每個鏈接都有一個列表,而不是兩個鏈接。我想象它真的很簡單,但我很想念它。在此先感謝
make linksList1 a set()而不是list() –
非常感謝你 – Harvey