3
因此,我一直試圖從「2005年至2013年之間喝酒」 颳起「2005 - 2013」,起初這段代碼對我有用,但現在我只能得到返回的空列表,我的要求還是有200個狀態碼python請求有時會返回空列表
import requests, lxml.html, csv
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'}
page = requests.get('http://www.cellartracker.com/wine.asp?
iWine=91411',headers=headers)
print(page.status_code)
html = lxml.html.fromstring(page.content)
content_divs = html.xpath('//a[@title="Source: Community"]/text()')
print(content_divs)
不知道我是否應該開始使用硒這樣做刮痧,因爲它是一個js的網站,如果是不知道如何做,要麼這樣一些基本的幫助將是有益的! 謝謝!
如果它是一個js的網站,肯定你需要使用'Selenium'或類似工具刮它 – gaback
我得到預期的結果,不知道爲什麼它會停止工作,你是否試圖一遍又一遍解析相同的網站有時候會得到一個空的列表?如果你想引用使用'Selenium'進行搜刮,我只是[回答](https://stackoverflow.com/a/45315393/5103802)這個問題的一個問題。 –