2013-03-01 64 views
0

我只需要從網頁http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html中提取這些出版物,其中第一作者是Rahul Rao。如何使用jsoup從網頁中提取特定內容

我試過下面的代碼,但它沒有給我任何輸出。

for(Element element : doc.select("table span.this-person.title")){ 
System.out.println(element.text()); 
} 

我需要什麼來獲得首選輸出?先謝謝你。

+0

請你們幫我出this.I我堅持在這裏.... – user1320030 2013-03-02 06:35:25

回答

1

下面的代碼會給你預期的輸出..看看它是否可以幫助你!

Document doc = Jsoup.connect(「http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html」).get(); 元素span = doc.select((「div [class = data]」));

//System.out.println(span.tagName("span")); 
    for (Element src : span) { 

     for(int i=0;i<src.childNodeSize();i++){ 
      if(src.childNodes().get(0).toString().contains("Rahul Rao")){ 
       if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){ 
        System.out.println(src.childNodes().get(i)); 
       } 

      } 
+0

謝謝Satyendra ... – user1320030 2013-03-02 13:12:46

0

我試圖提取發佈在頁面上的出版物並取得了一些成功。

的代碼如下:

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get(); 
    Elements span = doc.select("span"); 
    for (Element src : span) { 
     if (src.tagName().equals("span")){ 
      System.out.println(); 
      System.out.print(src.ownText()); 
     } 
    } 

請看看是否有幫助!

+0

但它給我的只有全部拉胡爾Rao..I的出版物需要這些出版物,其中拉胡爾·饒是第一作者。 – user1320030 2013-03-02 08:36:55

+0

你能告訴我什麼應該是你的預期產出或哪些出版物Rahul Rao是第一作者。 – Satyendra 2013-03-02 10:22:28