我想創建一個網絡蜘蛛,能夠從其他網站獲得一些有用的信息。 我如何從網站獲取文件並存儲到我的服務器? 例如: 該文件的網址是http://www.abc.com/attachment.php?aid=abc 我如何讓我的網站的用戶下載文件時不顯示頁面http://www.abc.com/attachment.php?aid=abc?asp.net(網絡蜘蛛)
0
A
回答
0
0
有很多方法可以去做。
WebClient
類可用於獲取網頁資源,例如網頁。
如果你想抓取一個網站,你還需要解析內容,以便跟蹤鏈接並下載圖像和其他資源(CSS,Javascript等......) - 我建議使用一個解析器,如HTML Agility Pack解析HTML以便您可以查詢這些資源(您可能還想使用WebClient
下載)。
相關問題
- 1. 阻止網絡蜘蛛
- 2. 使用vb.net的網絡爬蟲/蜘蛛
- 3. Highchart蜘蛛網絡圖,pointPlacement和tickInterval
- 4. Python網絡蜘蛛:如何解決captcha?
- 5. 網絡蜘蛛需要的幫助
- 6. 製作網絡爬蟲/蜘蛛
- 7. 建議想:網絡蜘蛛用Perl
- 8. Nutch網絡蜘蛛,索引整個網絡
- 9. 最佳網站蜘蛛?
- 10. 蜘蛛不爬行網頁
- 11. Highchart蜘蛛網圖表
- 12. 減慢蜘蛛網址
- 13. 蜘蛛網圖Ruby on Rails
- 14. 如何繪製蜘蛛網
- 15. scrapy:蜘蛛中的小蜘蛛?
- 16. 網絡蜘蛛如何抓取::之前的內容?
- 17. 客戶端JavaScript可以充當網絡蜘蛛嗎?
- 18. Python的網絡爬蟲(NameError:名字「蜘蛛」沒有定義)
- 19. Ruby網絡蜘蛛和搜索引擎庫
- 20. php擴展名「PCNTL」適用於網絡蜘蛛嗎?
- 21. 有人可以建議一個網絡蜘蛛嗎?
- 22. 當建立一個網絡蜘蛛,你應該使用遞歸?
- 23. 使用多線程來改進網絡爬蟲/蜘蛛
- 24. 在使用scrapy製作的網絡爬蟲中調用另一個蜘蛛的一個蜘蛛
- 25. 在蜘蛛情節
- 26. Scrapy DOMAIN_NAME的蜘蛛
- 27. Python的scrapy蜘蛛
- 28. 製作蜘蛛restarable
- 29. 佈局像蜘蛛
- 30. Scrapy與Scrapy蜘蛛