我不是直接用python,我一直在嘗試幾個小時來切斷列表中多個元素的少量字符。我想跟隨我的蜘蛛全部報廢環節是相對的,這裏是我的輸出只有幾行:scrapy和相對路徑
[u'../../../info/Auto/Dutch/']
[u'../../../info/Automazing/All_Star/']
[u'../../../info/AutoW/Passion/']
我試圖擺脫
"../../.."
這是我的代碼:
def parse(self, response):
hxs = HtmlXPathSelector(response)
links = hxs.select('//div[@class="partInnerDiv"]/table/tbody/tr')
items = []
for link in links:
item = myItem()
item ['url'] = link.select('th/a/@href').extract()
print complete_url(item ['url'])
items.append(item)
return items
def complete_url(string):
url = string
#if string.startswith("../"):
# return string[5:]
return url.replace('../../', '')
從上面的代碼中,你可以看到,我試了幾個方法,但沒有爲我工作:(
exceptions.AttributeError: 'list' object has no attribute 'replace'
任何意見讚賞。
感謝提示,我認爲它可能是這樣的:)它的痛苦,當你不明白的概念一個語言:( – mrki