2015-02-09 56 views
1

首先,請讓我明確告訴您, 我有一個網址,其中包含&,我想抓取它。scrapy從xml文件讀取開始網址,並且該網址具有「&」

當我手動抓取它的命令行,它完美的作品,但是當我告訴蜘蛛從xml文件中讀取起始URL,我得到了像XML文件問題沒有正確定義,我100%肯定這個問題是在起始URL的&,因爲當我用我的代碼讀取任何URL不具備&登錄它,TI完美的作品

我試圖改變&&但沒't work

help please

順便說一下,這是URL編碼百分號與符號 https://itunes.apple.com/ae/genre/ios-social-networking/id6005?mt=8&letter=A

回答

1

嘗試:

https://itunes.apple.com/ae/genre/ios-social-networking/id6005?mt=8%26letter=A 

或者,作爲替代,使用;作爲分隔符:

https://itunes.apple.com/ae/genre/ios-social-networking/id6005?mt=8;letter=A 
+0

感謝回答,我會明天更新你,因爲我必須與我的經理運行這個問題 – 2015-02-09 01:17:05

+0

你能幫我在這裏請http://stackoverflow.com/questions/28401403/xpath-how-to-get-text-when-那個兄弟-不是一個元素 – 2015-02-09 01:27:04

+0

@MarcoDinatsoli看起來像你已經解決了這個問題:) – alecxe 2015-02-09 02:25:24