2017-08-09 28 views
1

我想使用硒從網頁中提取圖像。我正在嘗試的代碼是如何用java腳本鏈接提取圖像?

import os 
import selenium 
from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 
from bs4 import BeautifulSoup 
driver = webdriver.Ie() 
url_database = "https://www-nass.nhtsa.dot.gov/nass/cds/CaseForm.aspx?xsl=main.xsl&CaseID=773013618" 
driver.get(url_database) 
driver.switch_to.frame(driver.find_element_by_id('menu')) 
element = driver.find_elements_by_xpath("//a[@class='menu' and contains(@onclick,'toggleswitch(this)') and contains(.,'Front') and contains(@href,'javascript')]")[0] 
driver.execute_script("arguments[0].click();", element) 
driver.switch_to.default_content() 
driver.switch_to.frame(driver.find_element_by_id('menu')) 

soup = BeautifulSoup(driver.page_source, "lxml") 
for link in soup.findAll('href'): 
    print(link) 

它有一些圖像與java腳本鏈接。如何從中提取所有圖像。

+0

* JavaScript鏈接* - n確信你的意思是在這裏,但你可能會困惑一些東西。 –

回答

0

網頁上的圖像出現在src標籤不href標籤

下載文件: -

  1. 獲取圖像的SRC屬性。
  2. 使用ImageIO.read的圖像讀取到一個BufferedImage
  3. 保存數據的BufferedImage使用ImageIO.write功能

來源: -

How to download an image using Selenium (any version)?

參考: -

enter image description here

+0

@Jack我的意思與Java腳本鏈接,如果是圖像沒有直接的圖像位置它就像「​​FRONT

FRONT
」與Java腳本 – surendra

+0

甚至SRC也不會放棄跟找到所有在Beautifulsoup任何引用。 – surendra

+0

爲什麼使用BeautifulSoup它anty特殊區域 –