2014-12-03 71 views
0

我只是在用scrapy做一個項目。什麼是start_urls的最大尺寸

我定義我的start_urls如下:

start_urls = [] 
    for i in (1,10): 
      for j in (1,10): 
        start_urls.append(base_url + '/' + str(i) + '/' + str(j)) 

但由於某些原因,scrapy只挑選了4鏈接抓取,而不是所有100鏈接。

在這個例子中

我只爬: base_urls/1/1 base_urls/1/10 base_urls/10/1 base_urls/10/10

這是爲什麼? scrapy中的start_urls有限制嗎?

+0

不存在這樣的限制;我會說這個答案在統計中。 – nramirezuy 2014-12-03 18:24:56

+0

@nramirezuy我剛剛編輯了我的問題隊友,會有幫助嗎? – nafas 2014-12-03 18:35:04

回答

1

不是scrapy的問題。
(1, 10) in Python表示具有2個元件110的元組。您可能需要使用range(1, 10)

另外如果你想100個鏈接,使用range(10)(給人01,...,9) 或range(1, 11)(給人12,...,10

+0

哈哈隊友,謝謝一拳,纔開始cracking py蟒蛇......我現在覺得很蠢:D – nafas 2014-12-03 18:40:22

+0

好抓,我以爲這是翻譯上丟失的東西。 – nramirezuy 2014-12-03 18:46:44