2012-10-16 172 views
4

我試圖從中文網站上抓取一些javascript生成的內容。我使用Selenium(和Python),因爲我無法直接抓取JavaScript內容。Python Selenium'WebDriver'對象沒有屬性錯誤

# -*- coding: utf-8 -*- 
from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 
from selenium.selenium import selenium 

import time 
import urllib2 
import httplib 
import urllib 
import re 
import base64 

browser = webdriver.Firefox() # Get local session of firefox 
browser.get("http://www...") # Load page (redacted here, but any works) 
browser.get_body_text() #Attempt to scrape body text 

而且我得到以下錯誤:

'WebDriver' object has no attribute 'get_body_text' 

其實,我似乎無法調用在selenium.selenium類中的任何命令。毫無疑問,我忽略了一些非常明顯的東西提前致謝。

+0

什麼是你使用的版本,對於版本'2.21.3'這個功能不可用 – avasal

+1

你也確定'從selenium.selenium進口硒'作品 – avasal

+0

感謝@avasal的回覆!我使用的是2.25.0。不完全確定是否從硒硒進口硒在這裏工作,但不知道如何從該類進口命令。當然不會拋出錯誤,並看到其他人使用此代碼。 – DannyMatt

回答

3
  1. 您只需要from selenium import webdriver
  2. 執行html= browser.find_element_by_xpath(".//html")以獲取最大元素頁面上的html元素。 (您可以通過多種方式執行此操作,並選擇任意數量的元素。)
  3. 執行html.text可返回頁面的文本。

.text是一個element對象的方法。第2步是將element分配到名稱html

相關問題