任何人都可以推薦一個網站爬蟲,可以顯示我的網站中的所有鏈接?網絡爬蟲應用
Q
網絡爬蟲應用
1
A
回答
1
Xenu是我找到的最好的鏈接檢查工具。它會檢查所有鏈接,然後給你一個選項來查看或導出它們。它是免費的,你可以從他們的網站下載它http://home.snafu.de/tilman/xenulink.html。
0
只要您是該網站的所有者(即您擁有所有文件),Adobe Dreamweaver就可以生成所有內部外部鏈接的報告,並報告所有損壞的鏈接(孤立文件)。但是,您必須先在Dreamweaver中設置您的網站。
5
W3C有最好的一個,我發現
0
如果你需要做的鏈接的任何後期處理,我建議任何機械化的許多變種。
在Ruby:
require "rubygems"
require "mechanize"
require "addressable/uri"
processed_links = []
unprocessed_links = ["http://example.com/"] # bootstrap list
a = WWW::Mechanize.new
until unprocessed_links.empty?
# This could take awhile, and depending on your site,
# it may be an infinite loop. Adjust accordingly.
processed_links << unprocessed_links.shift
a.get(processed_links.last) do |page|
page.links.each do |link|
link_uri = Addressable::URI.parse(link).normalize
# Ignore external links
unprocessed_links << link_uri.to_str if link_uri.host == "example.com"
end
end
end
大意的東西。
0
Larbin ...需要一點C++編碼,但它是完美的高性能網絡爬蟲基礎,可用於基本上做所有事情,從linkwalking到indexnig到數據採集。
相關問題
- 1. 網絡爬蟲
- 2. C++網絡爬蟲
- 3. PHP網絡爬蟲
- 4. Python網絡爬蟲
- 5. java網絡爬蟲
- 6. 網絡爬蟲類
- 7. 自動網絡爬蟲
- 8. 網絡爬蟲的功能
- 9. 網絡爬蟲,反饋?
- 10. 網絡爬蟲的Java
- 11. 遞歸網絡爬蟲perl
- 12. 簡單的網絡爬蟲
- 13. Python中的網絡爬蟲
- 14. 需要網絡爬蟲
- 15. 網絡爬蟲文本雲
- 16. 硒與python網絡爬蟲
- 17. 網絡爬蟲從Android Market
- 18. 網絡爬蟲不打印
- 19. 網絡爬蟲提取
- 20. 使用perl的網絡爬蟲
- 21. 使用vb.net的網絡爬蟲/蜘蛛
- 22. 用Java編寫網絡爬蟲
- 23. 使用網絡爬蟲的道德
- 24. 網絡爬蟲使用雙絞線
- 25. 錯誤使用C#網絡爬蟲
- 26. 在Scala中的網絡爬蟲算法
- 27. 識別敵對網絡爬蟲
- 28. 構建自動網絡爬蟲
- 29. 編寫網絡爬蟲模板
- 30. 網絡爬蟲產生輸出緩存