2014-06-13 142 views
0

我想從網址獲取標識,我已經在列表中存儲了一組網址,我希望獲得網址的證書部分,即標識部分,以供選擇URL,它不具有的ID部分應打印爲none.The代碼到目前爲止,我已經嘗試從網址獲取標識

text=[u'/fhgj/b?ie=UTF8&node=2858778011',u'/gp/v/w/', u'/gp/v/l', u'/gp/fhghhgl?ie=UTF8&docId=1001423601'] 
text=text.rsplit(sep='&', maxsplit=-1) 
print text 

輸出

[u'2858778011',u'/gp/v/w/', u'/gp/v/l', u'1001423601'] 

我希望能得到這樣的

[u'2858778011',u'None', u'None', u'1001423601'] 
+0

這真的是你的代碼嗎?我不認爲你可以在列表對象上做'rsplit';我不確定'rsplit'是否允許關鍵字參數;而且,在'&'符號處拆分文本也不會擺脫'node ='部分。 – elParaguayo

+0

另外,你如何確定哪個值有你想要的ID?即您想要第一個節點中的'node'值和最後一箇中的'docID'。 – elParaguayo

回答

0

使用urlparse,或者如果你真的想用串庫然後

prefix, sep, text = text.partition("&") 

(或只是text = text.partition("&")[2])。

+0

這會在「&」符號之後給出位,例如「node = 2858778011」。 – elParaguayo

+0

這不是要求什麼嗎?那麼,忽略了這篇文章中的幾個錯誤。 – Veedrac

+0

他的預期輸出是「2858778011」,所以我認爲他只是想在「=」之後的部分。可能值得擴展你的答案,以顯示如何使用urlparse。 – elParaguayo