蟒蛇硒找到類返回的整個網站，而不是元素

元素我想使用硒從這個網站將表讀入一個數據幀的大熊貓。 Link here 蟒蛇硒找到類返回的整個網站，而不是元素

，而不僅僅是表。不知道這裏有什麼問題。

url = r'https://www.hkex.com.hk/eng/market/sec_tradinfo/stockcode/eisdeqty.htm' 


path_to_chrome_driver = r'C:\chromedriver.exe' 
driver = webdriver.Chrome(executable_path=path_to_chrome_driver) 
driver.get(url) 
driver.find_element_by_class_name('table_grey_border').find_element_by_tag_name('tbody') 
z = pandas.read_html(driver.page_source, flavor='bs4') 

print(z)

注意：我也嘗試了下面的代碼，但結果仍然相同。

driver.find_element_by_class_name('table_grey_border')

來源

2017-02-05 jake wong

當你不使用從find_element_by_class_name的返回值，你不會看到這些結果，您需要使用您的find_element_by_class_name的返回值。

其實你使用driver.page_source這是整個html。

更改此：

driver.find_element_by_class_name('table_grey_border').find_element_by_tag_name('tbody') 
z = pandas.read_html(driver.page_source, flavor='bs4')

要這樣：

res = driver.find_element_by_class_name('table_grey_border').find_element_by_tag_name('tbody') 
print (res)

來源

2017-02-05 08:05:18

@omri_sasdon我得到了一個TypeError：雖然不能讀取類型'WebElement''錯誤信息的對象。在下面的例外中被忽略的異常：> ' –

@jakewong，這是因爲它不是html，請嘗試打印res以查看返回的值。 –

我使用了'res.get_attribute（'outerHTML'）'，但仍然無法將它饋送到熊貓中以檢索表格。 –

如果你想要的只是一個特定的元素HTML代碼，你需要使用下面的代碼：

driver.find_element_by_class_name('table_grey_border').find_element_by_tag_name('tbody').get_attribute('outerHTML')

來源

2017-02-05 08:21:15 Andersson

我仍然無法將每個行讀入'pandas Dataframe'。它現在告訴我，沒有發現表格 –

您是否使用'z = pandas.read_html（driver.find_element_by_class_name（'table_grey_border'）。find_element_by_tag_name（'tbody'）。get_attribute（'outerHTML'），flavor ='bs4'） '？ – Andersson

是的。我是那麼做的。我甚至用你的代碼重新檢查過它。仍然給我'找不到表格' –

蟒蛇硒找到類返回的整個網站，而不是元素

回答

相關問題