2016-10-25 17 views
1

我正在嘗試創建一個python腳本來抓取公共縣記錄網站。我最終希望能夠擁有所有者名稱列表,並通過所有名稱運行腳本,並提取最近的信託信息(貸方名稱和日期提交)。對於下面的代碼,我只是將所有者名稱寫爲字符串'ANCHOR EQUITIES LTD'。搜索結果不會更改URL - 使用Python和Selenium的網頁刮

我已經使用Selenium自動將所有者名稱輸入到表單框中,但是當按下「返回」按鈕並顯示結果時,網站url不會更改。我嘗試使用xpath查找表中的特定文本,但是當我查找它時,路徑不存在。我已經斷定該路徑不存在,因爲它正在搜索第一頁上的xpath而沒有顯示結果。 BeautifulSoup4不會在這種情況下工作,因爲解析URL只會返回一個空白搜索HTML表單

見下面我的代碼:

from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 

browser = webdriver.Chrome() 

browser.get('http://deed.co.travis.tx.us/ords/f?p=105:5:0::NO:::#results') 

ownerName = browser.find_element_by_id("P5_GRANTOR_FULLNAME") 

ownerName.send_keys('ANCHOR EQUITIES LTD') 

docType = browser.find_element_by_id("P5_DOCUMENT_TYPE") 
docType.send_keys("deed of trust") 

ownerName.send_keys(Keys.RETURN) 

print(browser.page_source) 

#lenderName = browser.find_element_by_xpath("//*[@id=\"report_results\"]/tbody[2]/tr/td/table/tbody/tr[25]/td[9]/text()") 
    enter code here 

我註釋掉是給我找麻煩變量。請幫幫我!!!!

如果我沒有正確解釋我的問題,請隨時提問,我會澄清任何問題。

+0

的代碼* *投擲的錯誤路線,或者只是你認爲是什麼問題呢? – n1c9

回答

0

我想你幾乎已經擁有它了。

您匹配元素,你有興趣使用:

lenderNameElement = browser.find_element_by_xpath("//*[@id=\"report_results\"]/tbody[2]/tr/td/table/tbody/tr[25]/td[9]") 

下次訪問該元素的文本:

lenderName = lenderNameElement.text 

或單步:

lenderName = browser.find_element_by_xpath("//*[@id=\"report_results\"]/tbody[2]/tr/td/table/tbody/tr[25]/td[9]").text 
+0

感謝您的幫助。我想到了。 –

0

你有沒有使用下面的xpath?

//table[contains(@summary,"Search Results")]/tbody/tr 

我已經檢查了它的工作perfect.In,你必須遍歷每個TR