2011-08-11 25 views
3

我希望能夠保存一個頁面,然後使用lxml.html.parse(),但我想知道是否可以直接從打開的頁面上執行該操作?是否可以使用Selenium/Python而不產生可見窗口?我可以使用lxml嗎?

我使用Ubuntu,如果它有任何區別。

編輯:有一種方法直接使用xpath(find_element_by_xpath),所以我想我不需要lxml。但要保存頁面,您只需調用page_source方法即可。

+0

你也可以使用PowerShell來獲取掛鉤IE進程,得到的文檔元素和設定值 – deadfish

回答

2

要回答'使用Selenium不會產生一個可見的窗口'的問題,是的,你可以很容易地在Ubunutu上使用PyVirtualDisplay

from pyvirtualdisplay import Display 
from selenium import webdriver 

display = Display(visible=0, size=(800, 600)) 
display.start() 

# now Firefox will run in a virtual display. 
# you will not see the browser. 
browser = webdriver.Firefox() 
browser.get('http://www.google.com') 
print browser.title 
browser.quit() 

display.stop() 

代碼爲this blog post

相關問題