當Web瀏覽器被要求加載一個URL時,它會向Web服務器發出一個HTTP請求,以獲得與該HTTP請求相對應的響應。收到響應後,它會分析響應(HTML文檔)以獲取其他資源(如果有)。因此,Web瀏覽器會自動向Web服務器發出更多的HTTP請求。在Java中模擬Web瀏覽器行爲
在Java中,我們可以使用java.net.URLConnection
來爲特定URL發出HTTP請求。迴應將在很短的時間後提供。然後,我們需要解析接收到的HTML響應,並逐一爲每個檢測到的資源發出HTTP請求。
有沒有什麼辦法可以讓我們自動發出這些自動HTTP請求?
或者至少是否存在解析HTML文檔並提取應該請求的所有資源列表的解析器?
尋找「java模擬瀏覽器」可能會讓你到你想去的地方。 http://htmlunit.sourceforge.net/ – scrappedcola
你實質上是在問:「如何用Java編寫Web瀏覽器?」這對於SO應該是的問答格式來說太廣泛了。否則,您需要建議使用HTML解析工具 - 請參閱[help/on-topic]中的#4 –