我想通過<select
>標記刮掉更改其內容的網頁。當我選擇不同的選項時,頁面內容會動態變化。我想知道是否有方法可以從python腳本中更改選項,以便我可以從<select>
標記中的所有不同選項的所有不同頁面獲取內容。如何刮更改內容的網頁<select>標記
3
A
回答
0
我假設你使用一些類似urllib的庫來做刮擦。您已經知道該網站的內容會動態變化。我還假設動態內容使用服務器端交互。這意味着,使用javascript(ajax),瀏覽器根據選擇的值從服務器請求新數據)。
如果是這樣,那麼你可以嘗試在你的網頁抓取庫中模擬對服務器的ajax調用。
- 首先,使用瀏覽器調試工具找到正在調用的服務器的URL。
- 拆分ajax調用中的參數部分
- 執行相同的調用以查找select標籤中的選項。
0
正如@Tichodroma說,當選擇發生變化,或者:
- 以前隱藏在頁面上的某些內容可見,或:
- 一個AJAX調用,以獲取一些額外的內容並將其添加到DOM中
在這兩種情況下都涉及JavaScript。看看它,並根據所發生的事情(案例#1和#2),你應該:
- 刮整個頁面,因爲所有你想要的內容已經在其中,或者:
- 多次調用通常使用Ajax檢索的
<select>
+0
該標籤有一個onchange事件=「this.submit.form()」,但我無法找到js頁面,所以我可以找出這個函數做什麼。任何想法? – bogdanciobanu
+0
要查找第一個場景,只需在查看頁面源時點擊ctrl + f並搜索當您選擇「
相關問題
- 1. 刮網頁內容
- 2. SimpleXMLElement如何更改標記內容(值)
- 3. 更改h3標記內容
- 4. 如何更改捲曲內容刮取器的標題位置
- 5. 更改網頁內容?
- 6. 更改網頁內容
- 7. 刮網頁包含錨標記<a href = "#"> using scrapy
- 8. 在C中刮動態網頁內容#
- 9. 從網頁上颳去內容
- 10. 蟒蛇刮網頁並解析內容
- 11. 刮內容從網站頁面
- 12. 如何更改標記圖標它被挖掘的內容?
- 13. 使用Ajax更改網頁的內容
- 14. 檢測網頁內容中的更改
- 15. PHP從表HTML標記網頁刮
- 16. 如何刮<br> - 限制內容在一個網頁與rvest?
- 17. 如何在DASH內容的<video>標記中啓用音軌更改?
- 18. 如何標記您的網頁以找到您的內容?
- 19. 如何獲取網頁的元標記的內容
- 20. 更改頁面的內容標題
- 21. 如何更改網站的網址更改內容?
- 22. 使用Ajax更改網頁內容
- 23. 如何更改Java中的HTML標記內容?
- 24. 如何在幾分鐘後更改網站頁面的內容?
- 25. 如何更改基於操作系統的網頁內容
- 26. 如何動態更改網頁的內容和樣式?
- 27. 網站有R刮,內容
- 28. 網站如何每天更改內容?
- 29. 如何防止更改頁腳內容?
- 30. 如何讓內容腳本運行在網頁的更新和網址更改?
每個值只是'select'元素不會改變文檔交互你想要的內容稱爲文件。必須涉及一些JavaScript。找出發生了什麼,並將結果添加到您的問題。 – 2012-09-10 10:01:20
你使用什麼瀏覽器?我知道谷歌鉻至少可以改變它正在查看的HTML。有了這個,你可以進去並改變