2010-05-15 238 views
0

我有一個字典鏈接,其中包含映射到數字的元組。我如何加入第二個元組中的第二個URL以及urljoin()函數?我想要做的是獲得完整的鏈接,以便我可以運行遞歸函數search(),它將完整的URL作爲參數,查找每個URL中的所有鏈接,並將映射到鏈接的鏈接數存儲在數據庫中。將鏈接連接在一起字典

到目前爲止,我有:

>>> links 
{('href', 'http://reed.cs.depaul.edu/lperkovic/csc242/test2.html'): 1, ('href', 'test3.html'): 1} 

我試圖把它變成"http://reed.cs.depaul.edu/lperkovic/csc242/test3.html"

回答

0

1)在考慮python字典中的鍵時,沒有「first」或「second」的概念;鍵沒有定義的順序。

2)目前還不清楚你實際要做什麼。如果你更努力地描述你正在努力解決的問題,你會得到更好的幫助。另一方面,如果這是一項家庭作業,那麼你不應該在這裏尋找這種幫助。你應該問問你的TA。

+0

我需要的代碼與「http://reed.cs.depaul.edu加入「test3.html」/lperkovic/csc242 /'...是更好嗎? – ptabatt 2010-05-15 20:36:14

0

我認爲你應該重新考慮你如何存儲基本URL和URL片段。把它們存儲在你現在正在做的字典中會讓事情變得比現在要困難得多。

一個建議是在將它存儲在字典中之前生成完整的URL,從元組(和元組)中刪除'href'部分,並將URL本身用作鍵。事情是這樣的:

from urlparse import urljoin 
links = {} 
urlbase = 'http://reed.cs.depaul.edu/lperkovic/csc242/test2.html' 
links[urljoin(urlbase, 'test3.html')] = 1 

這將產生一個字典看起來像這樣:

>>> links 
{'http://reed.cs.depaul.edu/lperkovic/csc242/test3.html': 1}