網站:http://mbct.com/wp-content/uploads/Eisendrath-Jan-2016.pdf如何使用selenium python webdriver下載PDF文件?
錯誤:無法找到元素
也許這是因爲當我不做點什麼的下載圖標會消失嗎?
這是我的代碼:
# coding=utf-8
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys
import time
import os
site = 'http://mbct.com/wp-content/uploads/Eisendrath-Jan-2016.pdf'
br = webdriver.Chrome()
br.get(site)
br.find_element_by_xpath('//*[@id="icon"]').click()
您似乎試圖在PDF中查找XML元素。與HTML不同,PDF不與XML重疊。如果您在瀏覽器中訪問PDF,則顯示的下載圖標不是網頁的一部分。 –
如果您的目標看起來像下載PDF文件一樣,那麼您可以通過以您喜歡的任何方式下載URL來實現這一目標 - 您不需要使用webdriver(或任何Python) ,只需在curl中加載一個shell腳本即可。如果你確實想使用Python,'urllib.request'(Python 3)或'urllib2'(Python 2)就可以做到。 –