2015-05-10 98 views
-3

我是新來的刮。我正在嘗試使用JSOUP從網站上抓取數據。我想從<div><span><p>等標籤中抓取數據。有人可以告訴我如何做到這一點?用JSOUP刮網

+3

請告訴我們,到目前爲止您已經嘗試過,SO不是神奇地獲取代碼的地方。 – Zhedar

+1

http://jsoup.org/cookbook/ –

+0

我剛做了一個新項目,並添加了一個jsoup jar文件並建立了連接。我其實是新來的。我想要取消駐留在不同標籤中的數據,如上所示。 plzzz幫助我 –

回答

1

檢查this。一個基本的例子:

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.nodes.Element; 
import org.jsoup.select.Elements; 

public class Test { 

    public static void main(String[] args) throws Exception { 
     String url = "https://stackoverflow.com/questions/2835505"; 
     Document document = Jsoup.connect(url).get(); 

     String text = document.select("div").first().text(); 
     System.out.println(text); 

     Elements links = document.select("a"); 
     for (Element link : links) { 
      System.out.println(link.attr("href")); 
     } 
    } 

} 

這將首先打印頁上的第一div的文本,然後打印出網頁上的所有鏈接(a)的所有URL。


爲了獲得股利的具體類,請Elements elements = document.select("div.someclass")

要與特定的id來獲取申報單,做Elements elements = document.select("div#someclass")

如果你想通過所有選定的元素,這樣做:

for (Element e:elements) { 
    System.out.println(e.text()); 
    //you can also do other things. 
} 
+0

感謝JonasCz親愛的這是關於其他div和div與特定的類名和ID –

+0

@MuhammadWaqas,我已經更新了答案。 – JonasCz

+0

JonasCz謝謝你...... –