urlopen

    0熱度

    3回答

    我正在從網址中抓取簡單的文本文件。 def scrape_contents_ex(url): data = urllib2.urlopen(url) return data.read() 的問題是,它產生被阻塞新行和製表符 「\ t」 的, 「\ R」 等字符串 實施例: 這裏是網頁 當我用python打印字符串輸出時,它用各種\字符呈現: 我不知道如何正確處理從urlop

    1熱度

    1回答

    我有一個名爲href_w與一羣MP3下載鏈接的列表,但是當我執行這段代碼,它給了我一個錯誤: # Download file print(color.BLUE + "\n[*] Downloading requested mp3(s) ..." + color.END) for link in href_w: url = "http://www.mp3c.cc"+link.repla

    0熱度

    1回答

    你們對我最後一個問題都非常有幫助,所以我雖然會提出一個關於我一直面臨的問題的新問題。我導入了BeautifulSoup,並試圖從本網站的醫學院數據庫導出數據:https://services.aamc.org/msar/home。我創建了一個「for」循環來打開和解析網站,然後打印包含學校所在城市和州的特定範圍的數據。執行代碼後,我很興奮地發現我的代碼正在工作!!並且驚訝地發現它在第三次學校之後返

    -1熱度

    2回答

    新用戶在這裏。我是開始以獲得Python語法的竅門,但不斷被for循環拋出。我理解到目前爲止所達到的每個場景(以及我之前的例子),但似乎無法爲我當前的場景提出一個場景。 我正在玩BeautifulSoup來從應用程序商店中提取功能作爲練習。 我創建了一個包含GooglePlay和iTunes網址的列表。 list = {"https://play.google.com/store/apps/det

    0熱度

    1回答

    我已經通過了論壇搜索,試圖找出爲什麼下面的代碼不工作: import nltk, re, pprint from urllib import request url = "http://www.gutenberg.org/files/2554/2554.txt" response = request.urlopen(url) raw = response.read().decode('ut

    2熱度

    1回答

    我試圖解析使用urllib.request的urlopen()方法的網頁,如: from urllib.request import Request, urlopen req = Request(url) html = urlopen(req).read() 然而,最後一行返回的結果以字節爲單位。 所以我試圖對其進行解碼,如: html = urlopen(req).read().deco

    0熱度

    1回答

    打開一些參考我的網址https://cars.mail.ru/reviews/renault/?year=2010-2016 和我應該開在那裏 https://cars.mail.ru/reviews/renault/sandero_stepway/2015/143355/ https://cars.mail.ru/reviews/renault/sandero/2015/147850/ ht

    0熱度

    1回答

    我想測試一個簡單的方式來寫,從本地到一個文件運行Python腳本的消息(也可能不會在腳本的時候存在一個共享目錄中的文件運行),可以託管在一個共享目錄(即Dropbox鏈接)中,並且其路徑由url指定。 1)收存箱只是選擇作​​爲一個例子,因爲它是衆所周知的,並且容易的。如果將最後一個dl = 0更改爲dl = 1,我已經能夠從共享目錄中已存在的文件中檢索內容。 示例:(不使用真實鏈接):我有書面一

    0熱度

    1回答

    我正在使用BeautifulSoup('lxml'解析器)與urllib.request.urlopen()以從網站獲取文本信息。但是,當我在Acitivity Monitor中檢查網絡部分時,我看到python下載了大量數據。這表明不僅文本被下載,而且圖像也被下載。 當使用BeautifulSoup進行網頁瀏覽時,是否可以避免下載圖像?

    4熱度

    2回答

    我試圖打開了一個網址爲我的項目,這裏是我的代碼: from urllib2 import urlopen page = urlopen("https://docs.python.org/3/howto/urllib2.html") contents = page.read() 這只是一個演示一個簡單的代碼但是,當我運行代碼,我得到了以下錯誤「導入錯誤:無法導入名稱的urlopen」 我試着