如何使用jsoup從網頁中提取特定內容

我只需要從網頁http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html中提取這些出版物，其中第一作者是Rahul Rao。如何使用jsoup從網頁中提取特定內容

我試過下面的代碼，但它沒有給我任何輸出。

for(Element element : doc.select("table span.this-person.title")){ 
System.out.println(element.text()); 
}

我需要什麼來獲得首選輸出？先謝謝你。

來源

2013-03-01 user1320030

請你們幫我出this.I我堅持在這裏.... – user1320030 2013-03-02 06:35:25

下面的代碼會給你預期的輸出..看看它是否可以幫助你！

Document doc = Jsoup.connect（「http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html」）.get（）; 元素span = doc.select（（「div [class = data]」））;

//System.out.println(span.tagName("span")); 
    for (Element src : span) { 

     for(int i=0;i<src.childNodeSize();i++){ 
      if(src.childNodes().get(0).toString().contains("Rahul Rao")){ 
       if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){ 
        System.out.println(src.childNodes().get(i)); 
       } 

      }

來源

2013-03-02 12:31:49 Satyendra

謝謝Satyendra ... – user1320030 2013-03-02 13:12:46

我試圖提取發佈在頁面上的出版物並取得了一些成功。

的代碼如下：

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get(); 
    Elements span = doc.select("span"); 
    for (Element src : span) { 
     if (src.tagName().equals("span")){ 
      System.out.println(); 
      System.out.print(src.ownText()); 
     } 
    }

請看看是否有幫助！

來源

2013-03-02 08:12:25 Satyendra

但它給我的只有全部拉胡爾Rao..I的出版物需要這些出版物，其中拉胡爾·饒是第一作者。 – user1320030 2013-03-02 08:36:55

你能告訴我什麼應該是你的預期產出或哪些出版物Rahul Rao是第一作者。 – Satyendra 2013-03-02 10:22:28

如何使用jsoup從網頁中提取特定內容

回答

相關問題