我一直在試圖抓取www.zomato.com超過一個星期,現在我通過網絡搜索了我的問題,但是我找不到適當的解決方案。所以我在這裏發佈了我的問題。
如何使用python和selenium webdriver捕獲https網站數據
這是我的webscraper代碼。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import Select
from selenium.webdriver.support.ui import WebDriverWait
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import NoAlertPresentException
import sys
import lxml
import unittest, time, re
class Sel(unittest.TestCase):
def setUp(self):
self.driver = webdriver.PhantomJS(executable_path='\phantomjs.exe')#phantom js
self.driver.implicitly_wait(30)
self.base_url = "https://www.zomato.com"
self.verificationErrors = []
self.accept_next_alert = True
def test_sel(self):
driver = self.driver
delay = 3
driver.get(self.base_url + "hyderabad")
driver.find_element_by_link_text("All").click()
for i in range(1,100):
self.driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
time.sleep(4)
html_source = driver.page_source
data = html_source.encode('utf-8')
if __name__ == "__main__":
當我在Python 3.4運行,即目錄/ PY -3.4 selenium.py 我得到這個錯誤
selenium-python-phantomJS-SSL。
任何人都可以幫助我解決這個問題嗎?
最好的問候。
粘貼錯誤消息的文本,不要鏈接到截圖。 –