我嘗試從這個網址得到一個代理列表:如何解析網頁中的動態內容?
這將是很酷,但端口號是動態的JavaScript內容。如何從此頁面獲取JavaScript生成的內容?我有jsoup和djNativeSwing,但我想在後臺線程中執行此操作。
JWebBrowser webBrowser = new JWebBrowser();
webBrowser.navigate("http://spys.ru/en/free-proxy-list/");
System.out.println(webBrowser.getHTMLContent());
此代碼返回空結果。請幫助。
check out'htmlUnit'我認爲這是你需要的一件事。謝謝。 –
我認爲這不適合我。我的代碼必須簡單且跨平臺。正如我所知的HTMLUnit - 必須有SYSTEM路徑 - 這很麻煩 – Trump
不,你不需要系統路徑。我創建了使用HTMLUnit的網頁爬蟲,它可以在http協議上工作。所以是的,它確實工作正常。讓我知道你是否想要更多的幫助。如果你願意,我可以寫一個正式的答案。 –