這是我的代碼來訪問一個網頁,但我需要添加參數: 1.通過從文件 讀取一行添加第一個參數2.第二個參數是一個計數器,以連續訪問頁面在python中添加url參數
import urllib2
import json,os
f = open('codes','r')
for line in f.readlines():
id = line.strip('\n')
url = 'http://api.opencorporates.com/v0.2/companies/search?q=&jurisdiction_code=%s&per_page=26¤t_status=Active&page=%d'
i = 0
directory = id
os.makedirs(directory)
while True:
i += 5
req = urllib2.Request('%s%s%d' % (url,id, i))
print req
try:
response = urllib2.urlopen('%s%s%d' % (url, id, i))
except urllib2.HTTPError, e:
break
content = response.read()
fo = str(i) + '.json'
OUTFILE = os.path.join(directory, fo)
with open(OUTFILE, 'w') as f:
f.write(content)
這不斷創建空目錄。我知道URL參數有問題。如何糾正這一點?
我認爲你的問題是在你的'Request'調用中。在我頭頂,字符串格式看起來不對。把你要求的網址放入一個變量中並打印出來,看看它的樣子。 – willy
這就是它正在打印的內容:http://api.opencorporates.com/v0.2/companies/search?q=&jurisdiction_code=%s&per_page=26¤t_status=Active&page=%dae_az5 在最後附加參數。 – blackmamba
然後,我會添加一個答案,我確切地看到問題是什麼。 – willy