我使用BeautifulSoup(BS4)構建刮刀工具,該工具允許我從位於'h1'標籤之間的任何TopShop.com產品頁面抽取產品名稱。無法弄清楚爲什麼我寫的代碼不工作!使用BeautifulSoup刮擦產品名稱
from urllib2 import urlopen
from bs4 import BeautifulSoup
import re
TopShop_URL = raw_input("Enter a TopShop Product URL")
ProductPage = urlopen(TopShop_URL).read()
soup = BeautifulSoup(ProductPage)
ProductNames = soup.find_all('h1')
print ProductNames
一個問題是您的代碼在最後一行生成SyntaxError:http://ideone.com/ByfJ7K – bernie 2013-02-14 23:35:21
「它不工作」?你看到的結果與你期望的結果有什麼不同? – bernie 2013-02-14 23:37:09
@bernie在我的結尾沒有看到語法錯誤。期望在H1標籤之間刮取數據,但上述內容似乎沒有任何回報。我對Python很陌生,找到自己的腳。 – 2013-02-14 23:46:59