urllib

    2熱度

    1回答

    我試圖解析一個頁面,該頁面具有使用Javascript __doPostBack()函數加載的不同部分。 鏈接的一個例子是:JavaScript的:__ doPostBack( 'ctl00 $ cphMain $ ucOemSchPicker $ DL-SCH $ ctl03 $ btnSch', '') 只要這個被點擊,瀏覽器不取一新網址,但會更新網頁的一部分以反映新信息。 我會傳入一個url

    5熱度

    4回答

    我希望Python在使用urllib時忽略Windows代理設置。我設法做到的唯一方法是禁用Internet Explorer上的所有代理設置。有沒有程序化的方法? os.environ['no_proxy']不是一個好的選擇,因爲我想避免代理所有地址。

    2熱度

    3回答

    PdfFileReader讀取PDF文件的內容,以創建一個對象。 我通過urllib.urlopen()查詢從CDN的PDF格式,這提供了我喜歡的對象,它沒有尋求一個文件。 PdfFileReader,然而使用seek。 有什麼簡單的方法來創建通過URL下載的PDF一個PdfFileReader對象。 現在,我能做些什麼來避免寫入磁盤,並通過file()再次閱讀。 在此先感謝。

    0熱度

    2回答

    如何在python腳本中登錄到我的Launchpad帳戶?任何示例代碼將不勝感激。 登錄URL是https://launchpad.net/+login,然後重新導向到像https://login.launchpad.net/fJLVSRbxPfKTpVDr/+decide 提前感謝!

    0熱度

    1回答

    我在創建使用URL的腳本時遇到了一些麻煩。我使用urllib.urlopen()來獲取所需URL的內容。但是其中一些URL需要認證。 urlopen提示我輸入我的用戶名和密碼。 我需要的是忽略每個需要認證的URL,只需輕鬆地跳過並繼續,有沒有辦法做到這一點? 我想知道捕捉HTTPError異常,但事實上,異常是由urlopen()方法處理的,所以它不起作用。 感謝您的每一個回覆。

    53熱度

    2回答

    我在urllib2的urlopen中使用了timeout參數。 urllib2.urlopen('http://www.example.org', timeout=1) 我該如何告訴Python,如果超時到期,應該提高自定義錯誤? 任何想法?

    1熱度

    4回答

    我使用Ubuntu的蟒蛇2.5,並且有一臺機器在同一網絡中的文件夾名爲machine1。該文件夾是共享的。 如何在該機器的特定文件夾中獲取文件? 我都試過了,沒有成功: urllib.urlopen('\\machine1\folder\file.txt')

    0熱度

    2回答

    其它這裏是我想獲取 https://salami.parc.com/spartag/GetRepository?friend=jmankoff&keywords=antibiotic&option=jmankoff%27s+tags 當我與抓取網站的網站的網址下面的代碼與下面的代碼顯示的內容: sock = urllib.urlopen("https://salami.parc.com/spart

    0熱度

    2回答

    有沒有辦法爲FancyURLopener()設置連接超時? 我正在使用FancyURLopener.retrieve()來下載文件,但有時它只是簡單的,這就是所有......我認爲這是因爲它仍然試圖連接,這是不可能的。那麼有沒有辦法設置這個超時時間? 感謝您的回覆

    0熱度

    2回答

    我剛從Linode租用了一個VPS,它具有python2.5和ubuntu 8.04。當我從python shell中運行以下命令: import urllib 我得到: ImportError: No module named urllib 什麼能是什麼原因?我怎樣才能將這個模塊添加到Python?不是用基本版本預先打包好嗎? 它可能是PYTHONPATH問題嗎?