2015-01-02 48 views
0

反正我有可能做這件事情我想做使用java讀取網頁的Html?

所以我想一個網站 上運行我的Java程序。如果我在頁面 它點擊一個鏈接,是看到了某些文本的任何地方在HTML代碼

這裏是我的意思

說我要找的文字是 香蕉,如果它發現它關係到html代碼 一個 鏈接頁面上的香蕉反正是有我能做到嗎?

+0

你需要一個Java的HTML解析器。搜索並使用它們,但首先閱讀文檔。 –

+0

有很多方法可以做到這一點。 –

回答

1

我會建議使用jsoup因爲它的CSS選擇

那麼代碼可能看起來有點像這樣:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); 
Elements elements = doc.select("a"); 
for(Element e : elements) { 
    if(e.text().contains("banana")) { 
     String linkURL = e.attr("abs:href"); 
    } 
} 
0

這個演示可能會幫助你。

String demo = "<select id='list'><option value='0'>First value</option><option value='1'>Second value</option><option value='2'>Third value</option></select>"; 


     Document document = Jsoup.parse(demo); 
     Elements options = document.select("select > option"); 

     for(Element element : options) 
     { 
      System.out.println(element.attr("value")); 
     } 

您需要使用Jsoup解析HTML更多關於其訪問this鏈接。

注:我已經使用String解析你可以直接連接到一個url並解析響應html。