在Python IRC bot上工作 - 如何查詢網站的標題？

html = urllib.request.urlopen(url) 
soup = BeautifulSoup(html) 
title = soup.find('title')[7:(title.len()-7)] 
return title

事情是，如果我查詢像維基百科網站與此，它與一個403我能做些什麼關於這個崩潰？（使用python3）

2012-06-18 argoneus

在萬維網上使用的HTTP中，403 Forbidden是一個HTTP狀態碼 –

我知道這是爲什麼？ – argoneus

你是以遞歸方式/迭代方式執行此操作，還是發送單個請求？你的403消息是什麼樣的？ – gfppaste

維基百科不希望你刮他們的網站。他們拒絕爲你服務，因爲他們認爲你在刮，而他們是對的。

2012-06-18 20:47:35

我能做些什麼嗎？像，有沒有辦法改變我的用戶代理？ – argoneus

維基百科有一個API，您可以使用它來抓取其內容（Wikipedia API），或者您可以下載它們的data，具體取決於您實際要提取的內容。

2013-10-07 08:12:56

回答