urlopen

    1熱度

    1回答

    我正在嘗試編寫一個Python程序來處理RSS,但是我有一些問題直接從互聯網。 我正在使用urllib.request.urlopen()來獲取文件。這裏是一個我有故障碼位: import xml.etree.ElementTree as et import urllib.request as urlget self.sourceUrl = sourceUrl #sourceUrl was

    2熱度

    2回答

    我試圖颳去谷歌專利的一些數據,和我的代碼的開頭是這樣的:(here是超鏈接,下面列出的URL) In [1]: import urllib2 In [2]: url='http://www.google.com/search?tbo=p&q=ininventor:\"{}\"&hl=en&tbm=pts&source=lnt&tbs=ptso:us'.format('John-Mudd')

    1熱度

    2回答

    今天早些時候,我能拉下面 import urllib2 url = 'http://www.google.com/search?tbo=p&q=ininventor:"John-Mudd"&hl=en&tbm=pts&source=lnt&tbs=ptso:us' req = urllib2.Request(url, headers={'User-Agent' : "foobar"})

    0熱度

    1回答

    我希望你能告訴我我的webscraper出錯的地方。 我想要做的是在頁面上某個字符串(「Sorry,Gruen Fan」)發生變化時收到通知。我能夠拉入字符串,但是,「If」函數似乎不起作用 - 它的輸出應該是「Text in in」。下面的代碼: from bs4 import BeautifulSoup from urllib import urlopen import re urls

    0熱度

    3回答

    我試圖用shutil/urlopen下載圖像,因爲不推薦?我不確定它是否被棄用,但urlretrieve不下載該文件,它只是創建映像名稱的文件夾。看過其他問題後,我看到一個提供此代碼的問題,但是我也發現了一個錯誤。 from urllib2 import urlopen from shutil import copyfileobj url = 'http://www.watchcartoo

    0熱度

    1回答

    我是Python和Django的總新手,並且正在通過http post傳遞數據到一個簡單的web應用程序。我瀏覽了Django教程,對於教授的內容有了很好的理解,但我並沒有將urls.py正則表達式濾掉。我已成功使用urlopen()作爲http get。將它用於POST不太成功。看起來好像我的app urls.py(不是項目urls.py)不允許POST進入我的應用程序views.py。非常有意

    -1熱度

    1回答

    cj=http.cookiejar.CookieJar() opener=build_opener(HTTPCookieProcessor(cj)) data={'uid' : uid , 'password' : password } #uid is username to the website data=urllib.parse.urlencode(data) data=data.e

    1熱度

    2回答

    我試圖抓住顯示供應商和特定產品的價格的產品列表頁面,但urllib.urlopen不工作 - 它將在亞馬遜上的所有其他頁面上工作,但我有點想知道亞馬遜的機器人可以防止在產品列表頁面上進行刮擦。任何人都可以驗證此?使用Chrome我仍然可以查看網頁源... 這裏有一個產品列表網頁的一個例子,我想湊:http://www.amazon.com/gp/offer-listing/B007E84H96/r

    0熱度

    2回答

    我需要經常從形式的網站,獲取並解析XML數據: https://api.website.com/stuff/getCurrentData?security_key=blah 我不能發佈安全的,因爲實際的連接數據的性質。當我把這個URL放到我的瀏覽器(Safari)中時,我返回了XML。 當我通過urllib2調用它時,我得到垃圾。 f = urllib2.urlopen("https://ap

    1熱度

    1回答

    我真的很努力地研究如何打印到列表。我想打印我指定的URL的服務器響應代碼。你知道我怎麼改變代碼打印輸出到列表中?如果不是,你知道我在哪裏可以找到答案嗎?我現在一直在尋找幾個星期。 下面的代碼: import urllib2 for url in ["http://stackoverflow.com/", "http://stackoverflow.com/questions/"]: t