2015-10-11 61 views
-2

我需要訪問書籤中的所有鏈接(在Java程序中)。 我知道如何從書籤中獲取鏈接,但我不知道如何打開每個鏈接(在後臺),然後從一些文字鍵搜索。Java在後臺解析網頁

例如,我從書籤取http://www.bbc.com/earth/story/20151009-where-is-the-windiest-place-on-earth,我想從該位置解析頁面(但未在Web瀏覽器中打開),以查找單詞「north」出現多少次。

有人可以幫我嗎?

+0

這種最簡單的方法是[使用URL](https://docs.oracle.com/javase/tutorial/networking/urls/readingWriting.html) – QuakeCore

+0

我在「使用URL」網站子章節中找到「直接從URL」。感謝那一點;) – Doro

回答

1

您需要一些理解DOM的Java庫。試試JSoup

+0

是的,你說得對。我記得我曾經使用過一次JSoup庫,但在我看來,最好的方法是直接從URL讀取,因爲它不需要任何第三方庫,並且源代碼可以更快。感謝您的反饋意見 ;) – Doro