0
我有HTML頁作爲字符串在Java中,我需要從中提取JavaScript鏈接。有什麼好的和易於使用的庫,我可以使用?我擡頭看了Cobra和Neko,但我不認爲(也許我錯了)他們有我需要的東西,比如獲取標籤特定的內容。如何從Java中的HTML頁面提取JavaScript鏈接?
我有HTML頁作爲字符串在Java中,我需要從中提取JavaScript鏈接。有什麼好的和易於使用的庫,我可以使用?我擡頭看了Cobra和Neko,但我不認爲(也許我錯了)他們有我需要的東西,比如獲取標籤特定的內容。如何從Java中的HTML頁面提取JavaScript鏈接?
看看JSoup。它是一個HTML解析器,它具有用於查找dom元素的選擇器DSL(Domain Specific Language)。
例如,要查找所有a
標籤與href
,你可以這樣做:
Document doc = Jsoup.connect("http://www.google.com/").get();
Elements hrefAnchors = doc.select("a[href]");
如果你已經有下載爲String
的HTML,您可以使用parse(String)
方法:
String html = "<p>Welcome to <a href='http://www.google.com/'>Google</a>.</p>";
Document doc = Jsoup.parse(html);
謝謝你的回覆。我一定會研究它。但正如我上面說的,我已經把解析好的頁面當作string.I不需要建立一個新的連接來獲取頁面。 'Jsoup'也會在這種情況下工作嗎? – Amit
是的,你可以。查看我的答案的最新編輯。 –
謝謝。我相信這對我而言將起作用。 :) – Amit