urlparse

    2熱度

    2回答

    我一個CSV具有以下結構工作: "2012-09-01 20:03:15","http://example.com" 的數據是我的瀏覽歷史記錄的清理傾倒。我有興趣計算特定日期前五個唯一的域名。這是我到目前爲止: from urlparse import urlparse import csv from collections import Counter domains = Count

    3熱度

    1回答

    當netloc是空的urlparse.urlunparse是不一致的: >>> urlparse.urlunparse(('http','','test_path', None, None, None)) 'http:///test_path' >>> urlparse.urlunparse(('ftp','','test_path', None, None, None)) 'ftp:///

    11熱度

    5回答

    我很新的python。我試圖解析一個URL文件只留下域名。 我的日誌文件中的一些網址以http://開頭,有些以www.some開頭。 這是我的代碼的一部分剝去http://部分。我需要添加什麼來查找http和www。並刪除? line = re.findall(r'(https?://\S+)', line) 目前,當我運行的代碼只有http://被剝離。如果我將代碼更改爲以下內容: lin

    0熱度

    1回答

    我: from urlparse import urlparse s = "http://google.com" + "\n" # this line is read from file, when I loop over file's lines urlparse(s) ParseResult(scheme='http', netloc='google.com\n', path='', p

    16熱度

    1回答

    我想分析查詢部分從URL,這是我的代碼來做到這一點: >>> from urlparse import urlparse, parse_qs >>> url = '/?param1¶m2=2' >>> parse_qs(urlparse(url).query) >>> {'param2': ['23']} 該代碼看起來不錯,但「parse_qs」方法失去像「參數1」或查詢參數「參

    0熱度

    1回答

    我有以下網址的代碼:http://localhost/summary/myfile.csv 我想讓url看起來像這樣:http:// localhost/summary? file = myfile.csv 代碼將被寫入燒瓶。 我的第一個URL代碼如下: @app.route('/summary/<filename>',methods = ['GET']) def api_summary(fil

    2熱度

    2回答

    我正在使用python來生成一個查詢字符串,然後將被解析的JavaScript。 考慮一個相當「複雜」的數據塊: import urllib params = { 'record': 'customer', 'filters': [ ('id', '>', 5), ('name', 'startswith', 'Jean Luc')

    14熱度

    2回答

    有沒有一個標準功能來檢查IRI,來檢查URL顯然,我可以使用: parts = urlparse.urlsplit(url) if not parts.scheme or not parts.netloc: '''apparently not an url''' 我嘗試了上面的URL包含Unicode字符: import urlparse url = "http://f

    4熱度

    2回答

    在Python的urlparse中,可以使用urlparse解析URL,然後使用parse_qsl解析查詢。 我想刪除查詢(名稱,值)對,然後重建URL。 有一個urlunparse方法,但沒有unparse_qsl方法。 什麼是從qsl列表重建查詢的正確方法?

    0熱度

    1回答

    我想從查詢字符串中刪除某些項目,這樣做的最好方法是解析查詢字符串,迭代並刪除我不想要的特定密鑰並將其全部加入一起。 遵循python指南,它似乎是urlencode函數,他們說使用,不會像預期的那樣工作。 收取下面的代碼,它簡單地解析查詢字符串,然後將它連接在一起。我已將其設置爲保留空值。 >>> f = 'name=John%20Doe&seq=123412412412&wer' >>> q