0
我試圖從這website刮一堆信息。什麼是適當的標籤刮那些特定的信息?
我需要通過產品獲得產品列表看起來像:
[名稱,包裝,價格/公斤]
所以,對於第一個我的輸出是三個列表看起來像。
- [法國皇家獸醫飲食 - 防過敏DR 21,7千克,4,84]
- [法國皇家獸醫飲食 - 防過敏DR 21,14千克,3,71]
- [法國皇家獸醫飲食 - 防過敏DR 21,14kg,3,71]
我已經設法在名稱列表中獲取名稱。
from bs4 import BeautifulSoup
import csv
import urllib.request
from collections import *
import time
start_time = time.clock()
page_0=urllib.request.urlopen("http://www.zooplus.co.uk/shop/dogs/dry_dog_food/royal_canin_vet_diet")
soup_0 = BeautifulSoup(page_0.read(),"html.parser")
restricted_webpage=soup_0.find_all("tbody", {"class":"product-variants-list"})
readable_restricted_webpage=str(restricted_webpage)
soup_1 = BeautifulSoup(readable_restricted_webpage,"html.parser")
title=soup_1.find_all("tr", {"style":["background-color:#ffffff;", "background-color:#ededed;"]})
soup_title = BeautifulSoup(str(title),"html.parser")
name=[]
for b in soup_title.find_all("b"):
name.append(str(b).replace("<b>","").replace("</b>",""))
這兩個其他的信息很難得到我。 我看不到標籤,我可以用它來獲得(包裝,價格/公斤)夫婦的標籤。
我試了多個標籤,最近我得到了:("td", {"style":"background-color:#ededed;"},{"valign":"top"})
但我想我應該使用<span>
這種或那種方式?
你將如何繼續傢伙?