我試圖從表中獲取值,但它們不在HTML中。但是,當我在瀏覽器中檢查它們時,它們在HTML中是。我猜他們是動態生成的,但我如何使用Selenium或Python中的其他方式捕獲它們?使用Python和Selenium進行網頁抓取,不知道如何獲取動態數據
回答
你可以這樣做
from selenium import webdriver
import pandas as pd
import time
driver = webdriver.Chrome()
driver.get('https://www.predictit.org/Contract/7422/Will-Trump-veto-Russian-sanctions-bill-by-August-31#prices')
time.sleep(2)
tables = pd.read_html(driver.page_source) # returns list of dataframes
print(len(tables))
print(tables[2]) # this is table with YES
print(tables[3]) # this is the table with NO
此代碼僅取表,但你需要做一些清潔。你可以閱讀文檔pandas.DataFrame
一旦我安裝了所有必要的模塊,就做到了這一點。謝謝! 我將不得不查找「數據框」究竟是什麼。 – svadhisthana
爲了記錄,您必須在此解決方案運行之前點擊價格標籤。所以,「elem = driver.find_element_by_id('getPrices') elem.click()」需要在代碼中。 – svadhisthana
我打開的網址包含'#價格'。所以我不需要找到任何元素。 – ksai
- 1. 使用python進行網頁抓取以提取數據
- 2. 使用Python進行網頁抓取
- 3. 使用Python進行網頁抓取
- 4. 使用BeautifulSoup進行網頁抓取:正在獲取fundsupermart數據
- 5. 使用Python Request/lxml進行網頁抓取:從ul/li獲取數據
- 6. 如何使用網頁抓取工具獲取動態生成的JavaScript數據
- 7. Selenium/Web抓取/網頁抓取Python中的應用程序
- 8. 使用C#和.NET Framework進行屏幕抓取,網頁抓取,網頁收集,Web數據提取等工作
- 9. 網頁抓取動態內容與Python
- 10. Python中動態網頁抓取
- 11. 使用動態頁面抓取網站
- 12. 使用htmlunit抓取動態網頁
- 13. 使用ruby進行網頁抓取
- 14. 使用Java進行網頁抓取
- 15. 使用Java Swing進行網頁抓取
- 16. Google如何抓取動態網頁?
- 17. 網頁抓取,python和beautifulsoup
- 18. 如何在網頁抓取時獲取數值數據?
- 19. 使用Python和Webhose.io將網頁數據抓取成子格式
- 20. Python-完備數據(網頁抓取)
- 21. 使用Python抓取網站後獲取特定數據
- 22. 使用C抓取網頁數據#
- 23. 使用Scrapy抓取網頁數據
- 24. 使用Java抓取網頁數據
- 25. 使用Python從網頁獲取數據
- 26. 在android上使用python進行網頁抓取
- 27. 如何從網頁上抓取數據?
- 28. Python獲取網頁數據
- 29. 使用Nutch如何抓取uisng ajax網頁的動態內容?
- 30. scrapy/Python抓取但不抓取數據
你想要的表格,正確的 – ksai