我有兩個變量,一個包含絕對URL,另一個包含到另一個節的相對路徑。首先,我嘗試了一個簡單的連接。加入URL拋出異常
absolute_url = www.example.com
relative_url = /downloads/images
url = absolute_url + relative_url
當我打印url變量時,我有一個格式正確的URL。但是,當我嘗試使用請求或urllib2的檢索數據,大約有一半拋出異常的時候:「NoneType」對象有沒有屬性「的GetItem」
於是我研究,認爲也許我應該使用的urllib .urlparse.urljoin()來做到這一點,但我仍然得到錯誤。
但有趣的是,有時它有效,有時不起作用。關於這裏發生了什麼的任何想法?
編輯
下面是實際的代碼:
url = "http://www.hdwallpapers.in"
html = requests.get(url)
soup = BeautifulSoup(html.text)
categories = ("Nature", "Animals & Birds", "Beach", "Bikes", "Cars","Dreamy & Fantasy", "Others", "Travel & World")
random_category = random.randint(0, len(categories)) - 1
selected_category = categories[random_category]
selected_category_url = soup.find('a', text=selected_category)
category_page_url_join = urlparse.urljoin(url, selected_category_url['href'])
category_page_html = requests.get(category_page_url_join)
顯示出現錯誤的實際示例,包括使用requests/urllib2。 –