我需要在後臺打開一個網站,並在加載幾秒鐘後,下載頁面上的所有內容。使用python在後臺打開網站
我可以打開網頁,
import webbrowser
import string
url = 'www.face.com'
webbrowser.open(url)
但這將打開網頁瀏覽器,而我不需要實際顯示該網站是開放的。我想我可以使用wget來下載頁面。
我需要在後臺打開一個網站,並在加載幾秒鐘後,下載頁面上的所有內容。使用python在後臺打開網站
我可以打開網頁,
import webbrowser
import string
url = 'www.face.com'
webbrowser.open(url)
但這將打開網頁瀏覽器,而我不需要實際顯示該網站是開放的。我想我可以使用wget來下載頁面。
您可以使用硒。
from selenium import webdriver
driver = webdriver.PhantomJS("./phantomjs") # path to phantomjs binary
driver.get("www.face.com")
## refer https://pypi.python.org/pypi/selenium
driver.quit() # quit driver
如果你需要愚弄它被人類使用的硒訪問的網頁。但請記住,您可以使用各種HTTP客戶端下載內容(在這種情況下,您不會獲得任何動態加載的內容)。
Python有一個內置的HTTP客戶端,但我使用requests來重寫。
您可以使用CGI腳本和u應導入CGI
您可能需要使用ghost.py它是用Python編寫的WebKit的Web客戶端(PyQt的需要)。