這可能是一個愚蠢的問題,其答案顯而易見......但我無法得到它。查看頁面源代碼vs HTTPURLConnection
我試圖讀取使用Java程序的網頁srouce如下圖所示:
URL url = new URL(urlValue);
HttpURLConnection urlc = (HttpURLConnection) url.openConnection();
BufferedInputStream buffer = new BufferedInputStream(urlc.getInputStream());
StringBuilder builder = new StringBuilder();
byte[] by = new byte[1024];
int byteRead;
while ((byteRead = buffer.read(by)) != -1){
builder.append(new String(by, 0, byteRead));
}
buffer.close();
這是所有工作正常,我可以看到網頁的源文件... 當我打開在同一網址瀏覽器並右鍵單擊它並查看頁面源代碼。 Java程序的頁面源與我從瀏覽器中看到的不一樣。
我只是想知道原因。 我錯過了什麼嗎? 我該怎麼做才能從java程序中得到完全相同的結果?
感謝, 伊爾凡
有什麼不同?查看源代碼顯示瀏覽器在渲染過程中所做的更改,以及某些情況下腳本所做的更改,例如IE將剝離屬性和正常化大小寫的引號...... –