1
我試圖使用Python 2.7檢索嵌入在HTML頁面中的PDF文件。我曾嘗試使用urllib和BeautifulSoup,但沒有成功。我的問題是,當我顯示頁面的源代碼時,我找不到任何PDF鏈接。檢索即時生成並嵌入HTML頁面的PDF文件
以下是我嘗試下載的PDF示例:link。
如何在使用Python的計算機上下載此文件?
編輯:我剛剛意識到,PDF可能在飛行中生成。它甚至有可能自動下載這種類型的文件?
我試圖使用Python 2.7檢索嵌入在HTML頁面中的PDF文件。我曾嘗試使用urllib和BeautifulSoup,但沒有成功。我的問題是,當我顯示頁面的源代碼時,我找不到任何PDF鏈接。檢索即時生成並嵌入HTML頁面的PDF文件
以下是我嘗試下載的PDF示例:link。
如何在使用Python的計算機上下載此文件?
編輯:我剛剛意識到,PDF可能在飛行中生成。它甚至有可能自動下載這種類型的文件?
的Ciao,
這就是我工作的解決方案:
from bs4 import BeautifulSoup
from selenium import webdriver
import time
import pyautogui
browser = webdriver.Firefox()
browser.get('your-link') # Load page
browser.find_element_by_id('download').click() # here I press the download button of the PDF
time.sleep(0.5)
pyautogui.hotkey('enter')
time.sleep(0.5)
pyautogui.hotkey('enter')
browser.close()
我已經做了同樣的事情。你找到了解決方案嗎? – haltman
@haltman不,我嘗試了更多的東西,但沒有成功。我放棄了,但如果你找到它,我仍然對解決方案感興趣! – Deuce
我得到了我的解決方案,它的一點原始,但工作得很好,我使用硒庫自動打開網頁和pyautogui與對話窗口交互以保存文件,告訴我,如果你需要一個工作示例 – haltman