2015-10-25 40 views
0

我使用下面的代碼從頁面中提取內容。但是我現在想在一個認證頁面的頁面上使用它。有沒有什麼辦法可以在python中做到這一點?Python中已認證頁面上的xpath

以下是我正在使用的示例代碼。

from lxml import html 
import requests 
page = requests.get('http://www.thesiteurl.com/') 
tree = html.fromstring(page.text) 
logo = tree.xpath('//*[@id="wraper"]/div[3]/header/div[1]/div[2]/div[1]/a/img//@src') 
print logo 

回答

1

我假定你的意思是你要使用到得到的認證頁面requests(因爲你可以做任何你想做你獲取HTML之後)?

如果是這樣,它取決於頁面的認證方式。 requests文檔討論了在此處執行此操作的各種方法:link。最簡單的方案(用戶名,密碼)支持相當簡單的語法:

>>> requests.get('https://api.github.com/user', auth=('user', 'pass')) 
<Response [200]>