檢索即時生成並嵌入HTML頁面的PDF文件

我試圖使用Python 2.7檢索嵌入在HTML頁面中的PDF文件。我曾嘗試使用urllib和BeautifulSoup，但沒有成功。我的問題是，當我顯示頁面的源代碼時，我找不到任何PDF鏈接。檢索即時生成並嵌入HTML頁面的PDF文件

以下是我嘗試下載的PDF示例：link。

如何在使用Python的計算機上下載此文件？

編輯：我剛剛意識到，PDF可能在飛行中生成。它甚至有可能自動下載這種類型的文件？

來源

2017-04-06 Deuce

我已經做了同樣的事情。你找到了解決方案嗎？ – haltman

@haltman不，我嘗試了更多的東西，但沒有成功。我放棄了，但如果你找到它，我仍然對解決方案感興趣！ – Deuce

我得到了我的解決方案，它的一點原始，但工作得很好，我使用硒庫自動打開網頁和pyautogui與對話窗口交互以保存文件，告訴我，如果你需要一個工作示例 – haltman

的Ciao，

這就是我工作的解決方案：

from bs4 import BeautifulSoup 
from selenium import webdriver 
import time 
import pyautogui 

browser = webdriver.Firefox() 
browser.get('your-link') # Load page 
browser.find_element_by_id('download').click() # here I press the download button of the PDF 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
time.sleep(0.5) 
pyautogui.hotkey('enter') 
browser.close()

來源

2018-03-09 16:40:05 haltman

檢索即時生成並嵌入HTML頁面的PDF文件

回答

相關問題