2011-09-18 81 views
0

我想用jsoup來解析中間的文字,告訴你關於標題。如何解析特定文本?

http://www.upcominggames.com/2113/Halo+Combat+Evolved+Anniversary/ http://www.upcominggames.com/478/Gears+of+War+3/

些什麼呢jsoup標籤是分析這一點,只提取文章?

上面兩篇文章的共同選擇是什麼?

編輯:

我想要做的是分析這部分

戰爭

機器3個事實
戰爭機器3是由微軟和發佈的第三人稱射擊遊戲由Epic Games開發,它的 將於2011年9月20日在美國,澳大利亞和歐洲發佈,並於9月22日在日本 上發佈。戰爭3簡介
此的Xbox 360獨佔的結論戰爭三部曲,戰爭機器的齒輪

機器3名球員在 中間的生存,希望和兄弟情誼的一次激動人心的經歷和故事。這個第三人稱射手 戲劇性地引導玩家穿越令人興奮的世界,比以往更多的顏色和細節。此外,其令人興奮的多人模式將導致玩家在完成活動後仍然需要更多。

戰爭3遊戲的齒輪當他們玩戰爭機器3
任何人誰也起到了戰爭遊戲的齒輪會覺得熟悉,但是 這並不意味着他們不會面臨着一些新的驚訝。這些環境更加具有身臨其境的感覺,增加了戰爭機器特許經營所帶來的刺激與刺激。  擁有比以前的戰爭機器系列更多的敵人,戰爭機器3將爲 提供玩家一個全新的挑戰,因爲他們試圖拯救人類免受完全破壞。如果 的玩家擁有3D電視,他們將能夠以3D形式播放這一新版本,以獲得完全身臨其境的 體驗。

戰爭機器3多人的
多人增加的戰爭機器3使遊戲從戰爭2的齒輪開始 專用服務器來處理牽線搭橋邁出了一大步,Epic Games公司已經投入了大量的努力讓這個 成爲最好的Gears體驗。通過奪取領先者,山丘之王和其他多人模式, 玩家將能夠在線對陣其他玩家在激動人心的比賽中進行比賽。

我想解析粗體到一個單獨的textView,然後在它下面我想加載它的內容。 基本上它是如何在上面。

如果您高亮顯示的文本,然後單擊視圖選擇源你會看到什麼,我試圖解析

我熟悉jsoup。這部分只需要一些幫助。

+0

「解析中文字,告訴你有關的標題是」 - 你能解釋一點只是你想在這裏做什麼? –

+0

看看我的編輯 –

+0

你知道我現在在說什麼嗎? –

回答

2

是的,我明白你的意思了。我認爲如果你學習網頁源代碼並找到常見的鏈接標籤和屬性,Jsoup會很容易地提取出來。那些嘗試包括:

  • 得到有標籤的元素「格」
  • 屬性「ID」分配「遊戲說明」

文本從僅僅這兩個返回過濾器可能會得到你想要的。

例如,

編輯:簡化代碼,使用select(...)

import java.io.IOException; 
import java.util.ArrayList; 
import java.util.List; 

import org.jsoup.Jsoup; 
import org.jsoup.nodes.Document; 
import org.jsoup.nodes.Element; 
import org.jsoup.select.Elements; 

public class HaloStuff { 
    private static final String TEST_URL_1 = "http://www.upcominggames.com/" + 
     "2113/Halo+Combat+Evolved+Anniversary/"; 
    private static final String DIV_TAG = "div"; 
    private static final String ID_ATTR = "id"; 
    private static final String GAME_DESC = "game-desc"; 

    public static void main(String[] args) { 
     Document jsDoc = null; 

     List<String> textList = new ArrayList<String>(); 

     try { 
     jsDoc = Jsoup.connect(TEST_URL_1).get(); 

     Elements textEles = jsDoc.select("div[id=game-desc]"); 
     for (Element ele : textEles) { 
      System.out.println(ele.text()); 
     } 

     } catch (IOException e) { 
     e.printStackTrace(); 
     } 
    } 
} 
+0

完美..好吧,所以我理解jsoup更好的從你的代碼片段!非常感謝。另外,如何將粗體部分的格式設置爲有自己的文本並在每個粗體部分下面都有文章內容?就像在光環文章中一樣。 –

+0

「這是留給讀者的練習。」換句話說,不妨試一試,因爲這並不難。玩你的代碼。 –

+0

好的,非常感謝。我確定我可以弄明白。只需你的幫助,它會更快。大聲笑 –

2

你就應該能夠做到這一點的:

div#game-desc p 

你嘗試過什麼,這不是工作?