使用正則表達式在python中解析URL

我想要獲取從URL中顯示的查詢名稱和值。例如。 url='http://host:port_num/file/path/file1.html?query1=value1&query2=value2' 解析查詢名稱及其值並打印出來。使用正則表達式在python中解析URL

來源

2012-04-04 Myjab

向我們展示您嘗試過的。 – claesv 2012-04-04 10:45:58

我同意，最好不要使用regex和更好的使用urlparse但這裏是我regex。類似urlparse這樣的類是專門爲處理所有網址而開發的，並且比regex更可靠，因此如果可以的話，請使用它們。

>>> x = 'http://www.example.com:8080/abcd/dir/file1.html?query1=value1&query2=value2' 
>>> query_pattern='(query\d+)=(\w+)' 
>>> # query_pattern='(\w+)=(\w+)' a more general pattern 
>>> re.findall(query_pattern,x) 
[('query1', 'value1'), ('query2', 'value2')]

來源

2012-04-04 11:02:10 jamylak

可能值得詳細說明爲什麼正則表達式是這個釘子的錯誤錘子。 – 2012-04-04 11:07:04

好吧我想我已經非常簡短地解釋了它。如果你想要更好地解釋它：D – jamylak 2012-04-04 11:09:34

謝謝jamylak。你能告訴我怎樣才能把它分開一般。例如。如果查詢包含「name = asd＆name1 = qwerty」，爲此上述模式不起作用。所以，而不是使用名稱wat v可以在查詢模式中使用。因爲我是新的Python正則表達式，我問這個:) – Myjab 2012-04-09 09:44:50

不要使用正則表達式！使用urlparse。

>>> import urlparse 
>>> urlparse.parse_qs(urlparse.urlparse(url).query) 
{'query2': ['value2'], 'query1': ['value1']}

來源

2012-04-04 10:46:43 teukkam

並在一行'urlparse.parse_qs（urlparse.urlparse（「http://www.example.com:8080/abcd/dir/file1.html?query1=value1&query2=value2」）.query）' – Dikei 2012-04-04 10:49:34

或'[對url.prse（url）.query.split（「＆」）]中的pair.split（「=」）' – Kimvais 2012-04-04 10:50:11

使用正則表達式在python中解析URL

回答

相關問題