我的機器人使用美麗的湯來解析HTML,並打印出IRC中所說的鏈接的網頁標題。除了一件事情之外,這一切都有效:如果有人提供了死/假鏈接,機器人就會崩潰。不良鏈接崩潰Python IRC bot
當發現「http」時,鏈接抓取器會觸發,所以例如如果有人剛剛說「http」,它會因爲沒有響應而崩潰。有誰知道如何解決這一問題?
下面是爭奪的鏈接,並得到的網頁標題和職位的代碼部分是:
msg_split = msg.split(' ')
for item in msg_split:
if re.search('^http.*', item, re.I):
link = item
if item.find(','):
link = link.replace(',', ' ')
soup = BeautifulSoup.BeautifulSoup(urllib.urlopen(link))
link_title = soup.title.string
ircSend('PRIVMSG ' + args[2] + ' ' + link_title)
您能否提供導致機器人崩潰的行的片段? – Fraxtil 2012-07-28 02:20:47
添加整個HTML解析器 – 2012-07-28 02:24:55
縮進似乎是不正確的(不反映正確的邏輯可能使用)。請糾正它們。還要看看str.find()返回的內容:如果找不到任何內容,則返回-1。 – Tadeck 2012-07-28 02:52:08