2014-01-31 69 views
1

我想從網站中提取一些文本並存儲在字符串中。jSoup提取文本的DIV標記字符串

<div class="textclass" id="textid" itemprop="itemtext">I want to get this Text</div> 

什麼會進入問號?

protected Void doInBackground(Void... params) { 
      try { 
       Document document = Jsoup.connect(url).get(); 

       Elements text = document.select("???"); 

       desc = text.attr("???"); 
      } catch (IOException e) { 
       e.printStackTrace(); 
      } 
      return null; 
     } 

回答

3

在我結束後嘗試使用下面的

Elements text = document.select("div"); 
String desc = text.text(); 
Log.i(".........",+desc); 

日誌

01-31 04:45:15.272: I/.........(1233): I want to get this Text 

編輯:

您可以使用

Elements text = document.select("div[class=textclass"); 

或使用ID

Elements text = document.select("div[id=textid]"); 

Elements text = document.select("div[itemprop=itemtext]"); 
+0

哦對不起,我應該說,在網站上是一些div標籤。你的代碼不會找到我認爲的正確的一個..你有一個想法如何識別正確的div? – thankyou

+0

@thankyou那麼你應該編輯你的問題,併發布html和sepcify你需要什麼,沒有它,沒有人可以回答正確 – Raghunandan

+0

@thankyou http://stackoverflow.com/questions/9218246/getting-text-from-div-tags – Raghunandan

0

你可以試試這個:

Document doc1 = Jsoup.connect(url).get(); 
    Element contentDiv = doc1.select("div[id=textid]").first(); 
    String text=contentDiv.getElementsByTag("div").text(); 

    System.out.println(text); // The result 

因此獲得id爲 「文本ID」 保存在變量「股利文文本」。

+0

這將是邏輯上,但應用程序crahes:/ – thankyou