2016-04-29 61 views
0

我正試圖從網站收集數據。我有一個包含網站所有不同擴展名的Excel文件。 F.i. www.example.com/example2。我有一個腳本可以從站點中成功提取HTML,但現在我想爲所有擴展自動執行此操作。然而,當我說:如何向URL添加變量?

siteExtension = "example2" 
url = ("https://www.example.com/siteExtension") 
r = requests.get(url) 

代替:

url = ("https://www.example.com/example2") 
r = requests.get(url) 

我得到一個錯誤代碼。你們有什麼建議如何做到這一點?提前致謝!

回答

4

您需要將siteExtension的值連接到url字符串。您可以通過多種方式做到這一點,但這裏有兩個最常見的:

url = "https://www.example.com/" + siteExtension 

,或者在更普遍的形式:

url = "https://www.example.com/{}".format(siteExtension) 
+0

酷謝謝!如果我想添加兩個擴展?我只是做:+ siteExtension1 + siteExtension2? – titusflex

+0

試一下,看看,最好的學習方式。 ;) –

0

您需要將字符串拼接在一起,而不是使siteExtension的你的文字字符串的一部分,就像這樣:

siteExtension = "example2" 
url = ("https://www.example.com/" + siteExtension) 
r = requests.get(url) 
0

你有這樣的錯誤,因爲你不及格siteExtension變量的值到url,而是傳遞siteExtension字符串。

可以按如下方式解決這個問題:

siteExtension = "example2" 
url = ("https://www.example.com/" + siteExtension) 
r = requests.get(url) 

或者用這種方式:

siteExtension = "example2" 
url = ("https://www.example.com/%s" %(siteExtension)) 
r = requests.get(url)