2017-01-25 124 views
0

我已經制作了一個程序來訪問公司內部的網站,以便每小時檢索一小時內的訂單數量數據。訪問是好的,但試圖檢索數據是一個問題,因爲它是在混亂的表格格式。無法通過後端訪問。用BeautifulSoup&Selenium解析表格和麻煩

driver.get("companyurl") #fetching the site & feeding to beautifulsoup 
url = driver.page_source("companyurl") 
soup = BeautifulSoup(url) 
#this is where the issues start 

類型錯誤:「統一」對象不是可調用(2號線)

還具有檢索表本身與湯的問題,但這是另一天另一美元

回答

0

嘗試發送頁面的源代碼硒驅動程序接收直入BeautifulSoup解析:

driver.get("companyurl") 
soup = BeautifulSoup(driver.page_source) 

然後嘗試搜索你的表:

all_tables = soup.find_all('table').get_text() 

或者,如果你知道它的位置:

a_table = soup.find_all('table')[1].get_text() 
+0

工作PERF,最終的代碼是(工作了幾天之後) 'driver.get( 「公司網址」)'' url = driver.page_source' 'soup = BeautifulSoup(url,「html.parser」)' – Rob