2017-04-06 64 views
1

我試圖使用Python 2.7檢索嵌入在HTML頁面中的PDF文件。我曾嘗試使用urllib和BeautifulSoup,但沒有成功。我的問題是,當我顯示頁面的源代碼時,我找不到任何PDF鏈接。檢索即時生成並嵌入HTML頁面的PDF文件

以下是我嘗試下載的PDF示例:link

如何在使用Python的計算機上下載此文件?

編輯:我剛剛意識到,PDF可能在飛行中生成。它甚至有可能自動下載這種類型的文件?

+0

我已經做了同樣的事情。你找到了解決方案嗎? – haltman

+0

@haltman不,我嘗試了更多的東西,但沒有成功。我放棄了,但如果你找到它,我仍然對解決方案感興趣! – Deuce

+1

我得到了我的解決方案,它的一點原始,但工作得很好,我使用硒庫自動打開網頁和pyautogui與對話窗口交互以保存文件,告訴我,如果你需要一個工作示例 – haltman

回答

0

的Ciao,

這就是我工作的解決方案:

from bs4 import BeautifulSoup 
from selenium import webdriver 
import time 
import pyautogui 

browser = webdriver.Firefox() 
browser.get('your-link') # Load page 
browser.find_element_by_id('download').click() # here I press the download button of the PDF 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
browser.close()