我試圖從我的大學的一個網站上抓取數據,該網站使用Shibboleth作爲身份驗證/保護的一種形式。但是,我很難確定通過它的最佳方式以及我想要抓取的頁面。我有有效的憑據,我可以使用它登錄。有沒有人有任何建議如何完成這項任務?如何從受Shibboleth保護的網站上抓取數據?
1
A
回答
0
你可以用機械化來提交表單並登錄到網站:http://wwwsearch.sourceforge.net/mechanize/
0
我相信ECP輪廓是設計的非瀏覽器客戶端(即命令行)訪問Shibboleth的受保護的資源
嘗試一個Shibboleth wiki頁面上提供的示例客戶端我上面鏈接的
0
您也可以嘗試Apache JMeter,只記錄您的操作,製作一些腳本(並非如此簡單shibboleth),您可以自動訪問此頁面。
[編輯 - 更好的解決方案] 我相信在Shibboleth文檔頁面是scripts磨牀(另一個負載測試工具)。這個測試計劃實際上應該很容易修改和用於你的目的的Python(ok Jython)腳本
1
我一直在研究腳本Shibbolized登錄成功(在我的情況下,爲了監視Shibboleth IdP及其保護的應用程序)。
我使用Python的urllib
模塊及其類來處理重定向跟隨和cookie傳遞(用於Shibboleth)和登錄表單發佈。經過一些修改後,urllib可以讓您通過Shibbolized登錄成功。您可以使用這種方法來處理Shibbolized網站的初始登錄,然後通過直接使用Python的urllib
來處理這個問題。
相關問題
- 1. R - RCurl從受密碼保護的網站抓取數據
- 2. 如何從網站上抓取數據
- 3. 如何使用Excel VBA從受腳本保護的站點抓取數據?
- 4. 如何從受密碼保護的https網站查詢數據
- 5. 如何保護我的網頁上某些數據的抓取?
- 6. 從網站抓取數據
- 7. 從網站抓取數據
- 8. 如何從使用Java的網站中提取受登錄保護的數據?
- 9. 從網站上抓取C#數據
- 10. Php從網站上抓取數據
- 11. 抓取密碼保護網站
- 12. 網站上受保護的CSS?
- 13. 如何保護網站免受攻擊
- 14. 如何從使用Java(Android)的網站上抓取數據?
- 15. 如何從網頁上抓取數據?
- 16. 如何從網站上抓取信息?
- 17. 如何使用Python 2從網站上抓取數據?
- 18. 如何使用Jaunt庫從網站上抓取數據?
- 19. 從受保護的Wordpress網站中排除受htpasswd保護的單個目錄
- 20. 我如何從Python網站抓取網站上的pdf鏈接
- 21. 如何保護網站免受xss(跨網站腳本)
- 22. 如何從抓取工具獲取數據到我的網站?
- 23. 從受密碼保護的網站讀取信息
- 24. 屏幕從網站抓取數據
- 25. 從網站抓取XML文件數據
- 26. 受登錄保護的網站部分
- 27. 未受SSL保護的網站
- 28. 如何保護網站用戶名/密碼從RAM抓取惡意軟件
- 29. 網絡抓取密碼保護網站使用R
- 30. PowerShell 2.0 - 如何從密碼保護的網站請求數據?
也許你應該谷歌,並保持你的自我 – Ibu 2011-05-25 04:07:14
@Ibu爲什麼?他不問如何繞過安全,只是如何以編程方式登錄。 – 2011-05-25 04:09:12