我已經寫了scrapy蜘蛛來刮出一些html標籤。現在的問題是,這個蜘蛛完美地工作在互聯網上運行的網址,但不是在本地主機上的網址。我的意思是,蜘蛛生成本地計算機上資源的url時出現錯誤,即使url完全正確,並且對於正在運行的站點的url時相同的資源正常工作。 有人可以清除我的這個疑問嗎?python scrapy能在localhost上正常工作嗎?
def parse(self, response):
hxs = HtmlXPathSelector(response)
con = MySQLdb.connect(host="localhost",
user = "username",
passwd="psswd",
db ="dbname")
cur = con.cursor()
title = hxs.select("//h3")[0].extract()
desc = hxs.select("//h2").extract()
a = hxs.select("//meta").extract()
cur.execute("""Insert into heads(h2) Values(%s)""",(a))
con.commit()
con.close()
它產生了什麼錯誤?你使用本地計算機資源的'http:'url還是'file:'url? – 2012-02-04 19:16:36
嘿布魯克斯。我用locahost的http:url也添加了我的代碼。在這個代碼中。即產生的錯誤是:標題= hxs.select(「// H3」)[0] .extract() \t exceptions.IndexError:列表索引超出範圍 – user1153986 2012-02-04 19:28:09