3
我希望能夠保存一個頁面,然後使用lxml.html.parse()
,但我想知道是否可以直接從打開的頁面上執行該操作?是否可以使用Selenium/Python而不產生可見窗口?我可以使用lxml嗎?
我使用Ubuntu,如果它有任何區別。
編輯:有一種方法直接使用xpath(find_element_by_xpath),所以我想我不需要lxml。但要保存頁面,您只需調用page_source方法即可。
我希望能夠保存一個頁面,然後使用lxml.html.parse()
,但我想知道是否可以直接從打開的頁面上執行該操作?是否可以使用Selenium/Python而不產生可見窗口?我可以使用lxml嗎?
我使用Ubuntu,如果它有任何區別。
編輯:有一種方法直接使用xpath(find_element_by_xpath),所以我想我不需要lxml。但要保存頁面,您只需調用page_source方法即可。
要回答'使用Selenium不會產生一個可見的窗口'的問題,是的,你可以很容易地在Ubunutu上使用PyVirtualDisplay。
from pyvirtualdisplay import Display
from selenium import webdriver
display = Display(visible=0, size=(800, 600))
display.start()
# now Firefox will run in a virtual display.
# you will not see the browser.
browser = webdriver.Firefox()
browser.get('http://www.google.com')
print browser.title
browser.quit()
display.stop()
你也可以使用PowerShell來獲取掛鉤IE進程,得到的文檔元素和設定值 – deadfish