網站www.kissanime.to的「瀏覽器啓用了JavaScript」保護功能,因此當您想要閱讀網站的html內容時,這個代碼將無法正常工作:從javascript保護的網站中提取HTML代碼
HtmlUnitDriver html = new HtmlUnitDriver();
String URL="https://www.kissanime.to/";
html.get(URL);
String pageSource=html.getPageSource();
System.out.println(pageSource);
這工作,但並不是有更好的方法來做到這一點:
URL kissanime = new URL("http://www.kissanime.to/");
URLConnection ks = kissanime.openConnection();
BufferedReader in = new BufferedReader(newInputStreamReader(ks.getInputStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
而且一段時間研究,我發現硒這是一個瀏覽器庫仿真器的後就像Jsoup和Rhino庫一樣,你將與jsoup建立初始連接然後你將添加犀牛,使它看起來像你有JavaScript或更好,但只有Jsoup和添加一些cookie來繞過保護。
我不會稱之爲「保護」。他們只是給你一個警告,說他們的網站將無法正常工作,除非你啓用了Javascript –
這不是一種保護,這是一種警告,無論如何,我曾經這樣做過。 –