urlparse

2熱度

2回答

我一個CSV具有以下結構工作： "2012-09-01 20:03:15","http://example.com" 的數據是我的瀏覽歷史記錄的清理傾倒。我有興趣計算特定日期前五個唯一的域名。這是我到目前爲止： from urlparse import urlparse import csv from collections import Counter domains = Count

3熱度

1回答

爲什麼urlparse.urlenparse工作不一致？

當netloc是空的urlparse.urlunparse是不一致的： >>> urlparse.urlunparse(('http','','test_path', None, None, None)) 'http:///test_path' >>> urlparse.urlunparse(('ftp','','test_path', None, None, None)) 'ftp:///

11熱度

5回答

查找http：//和或www。並從域中剝離。離開domain.com

我很新的python。我試圖解析一個URL文件只留下域名。我的日誌文件中的一些網址以http：//開頭，有些以www.some開頭。這是我的代碼的一部分剝去http：//部分。我需要添加什麼來查找http和www。並刪除？ line = re.findall(r'(https?://\S+)', line) 目前，當我運行的代碼只有http：//被剝離。如果我將代碼更改爲以下內容： lin

0熱度

1回答

和裏urlparse '\ n'

我： from urlparse import urlparse s = "http://google.com" + "\n" # this line is read from file, when I loop over file's lines urlparse(s) ParseResult(scheme='http', netloc='google.com\n', path='', p

16熱度

1回答

分析查詢部分從URL

我想分析查詢部分從URL，這是我的代碼來做到這一點： >>> from urlparse import urlparse, parse_qs >>> url = '/?param1¶m2=2' >>> parse_qs(urlparse(url).query) >>> {'param2': ['23']} 該代碼看起來不錯，但「parse_qs」方法失去像「參數1」或查詢參數「參

0熱度

1回答

將參數值添加到燒瓶中的URL python

我有以下網址的代碼：http：//localhost/summary/myfile.csv 我想讓url看起來像這樣：http：// localhost/summary？ file = myfile.csv 代碼將被寫入燒瓶。我的第一個URL代碼如下： @app.route('/summary/<filename>',methods = ['GET']) def api_summary(fil

2熱度

2回答

Javascript的等效Python的urlparse.parse_qs（）？

我正在使用python來生成一個查詢字符串，然後將被解析的JavaScript。考慮一個相當「複雜」的數據塊： import urllib params = { 'record': 'customer', 'filters': [ ('id', '>', 5), ('name', 'startswith', 'Jean Luc')

14熱度

2回答

Python：如何檢查一個字符串是否是一個有效的IRI？

有沒有一個標準功能來檢查IRI，來檢查URL顯然，我可以使用： parts = urlparse.urlsplit(url) if not parts.scheme or not parts.netloc: '''apparently not an url''' 我嘗試了上面的URL包含Unicode字符： import urlparse url = "http://f

4熱度

2回答

Python urlparse.unparse_qsl？

在Python的urlparse中，可以使用urlparse解析URL，然後使用parse_qsl解析查詢。我想刪除查詢（名稱，值）對，然後重建URL。有一個urlunparse方法，但沒有unparse_qsl方法。什麼是從qsl列表重建查詢的正確方法？

0熱度

1回答

Urlecoding從字典回來的字符串

我想從查詢字符串中刪除某些項目，這樣做的最好方法是解析查詢字符串，迭代並刪除我不想要的特定密鑰並將其全部加入一起。遵循python指南，它似乎是urlencode函數，他們說使用，不會像預期的那樣工作。收取下面的代碼，它簡單地解析查詢字符串，然後將它連接在一起。我已將其設置爲保留空值。 >>> f = 'name=John%20Doe&seq=123412412412&wer' >>> q