2012-06-18 21 views
0

這裏是我當前的代碼:在Python IRC bot上工作 - 如何查詢網站的標題?

html = urllib.request.urlopen(url) 
soup = BeautifulSoup(html) 
title = soup.find('title')[7:(title.len()-7)] 
return title 

事情是,如果我查詢像維基百科網站與此,它與一個403我能做些什麼關於這個崩潰? (使用python3)

+1

在萬維網上使用的HTTP中,403 Forbidden是一個HTTP狀態碼 –

+0

我知道這是爲什麼? – argoneus

+0

你是以遞歸方式/迭代方式執行此操作,還是發送單個請求?你的403消息是什麼樣的? – gfppaste

回答

4

維基百科不希望你刮他們的網站。他們拒絕爲你服務,因爲他們認爲你在刮,而他們是對的。

+0

我能做些什麼嗎?像,有沒有辦法改變我的用戶代理? – argoneus

0

維基百科有一個API,您可以使用它來抓取其內容(Wikipedia API),或者您可以下載它們的data,具體取決於您實際要提取的內容。