2013-08-16 53 views
0

我使用下面的代碼來驗證我的用戶代理的ID來獲得訪問網頁:用戶代理訪問的網站的Python在Linux中

url = 'http://...' 
user_agent = 'Mozilla/20.0.1 (compatible; MSIE 5.5; Windows NT)' 
headers = {'User-Agent':user_agent} 

req = urllib2.Request(url, headers=headers) 
response = urllib2.urlopen(req) 

不過,我使用Ubuntu現在,我該如何改變user_agent變量匹配linux標準?

回答

0

下面是一個例子Chrome瀏覽器的用戶代理的Linux:

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/507.12 
(KHTML, like Gecko) Chrome/25.31.00.00 Safari/507.12 

而且在Ubuntu上一個Firefox用戶代理:

Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:21.0) Gecko/20100001 

這裏是在Linux命令行瀏覽器的用戶代理。

Lynx/2.8.8dev.3 libwww-FM/2.14 SSL-MM/1.4.1 

他們真的沒那麼嚴格。要使用最安全的用戶代理(從成功的角度)使用Chrome或Firefox,但一定要觀察robots.txt文件。