我想解析一些URL並訪問該站點,並進一步報廢一些數據。解析URL的抓取任務
基本上我當前的代碼是:
i = 9
while(i < 118):
dict = {'start': i}
url1 = urllib.urlencode(dict)
url2 = urlparse.urljoin('http://intelligencesquaredus.org/debates/past-debates ', url1)
print url2
i = i + 9
其中產生的結果
http://intelligencesquaredus.org/debates/past-debates/start=9
http://intelligencesquaredus.org/debates/past-debates/start=18
http://intelligencesquaredus.org/debates/past-debates/start=27
但我希望鏈接是
http://intelligencesquaredus.org/debates/past-debates?start=9
任何幫助,將不勝感激。 在此先感謝
你到底要什麼?你有一個while循環,這就是你有許多鏈接的結果的原因。 –
許多鏈接的結果是好的,這是有意的行爲。我只需要格式是正確的,請再次檢查。 –
好的,你想'''而不是'/'? –